229 11 4MB
Hungarian Pages 173 Year 2011
INFORMÁCIÓKERESŐ NYELVEK II.
Pálvölgyi Mihály
MÉDIAINFORMATIKAI KIADVÁNYOK
INFORMÁCIÓKERESŐ NYELVEK II.
Pálvölgyi Mihály
Eger, 2011
Lektorálta: CleverBoard Interaktív Eszközöket és Megoldásokat Forgalmazó és Szolgáltató Kft.
A projekt az Európai Unió támogatásával, az Európai Szociális Alap társfinanszírozásával valósul meg.
ISBN 978-615-5221-03-3
Felelős kiadó: dr. Kis-Tóth Lajos Készült: az Eszterházy Károly Főiskola nyomdájában, Egerben Vezető: Kérészy László Műszaki szerkesztő: Nagy Sándorné
Kurzusmegosztás elvén (OCW) alapuló informatikai curriculum és SCORM kompatibilis tananyagfejlesztés Informatikus könyvtáros BA, MA lineáris képzésszerkezetben TÁMOP-4.1.2-08/1/A-2009-0005
INFORMÁCIÓKERESŐ NYELVEK II. Tartalom 1. Bevezetés ....................................................................................................................... 9 1.1 Célkitűzés (kurzusra) ........................................................................................ 9 1.2 A kurzus tartalma .............................................................................................. 9 1.3 A kurzus tömör kifejtése ................................................................................. 10 1.4 Kompetenciák és követelmények .................................................................... 10 1.5 Tanulási tanácsok, tudnivalók ......................................................................... 11 2. A természetes nyelveken alapuló keresőnyelvek...................................................... 12 2.1 Célkitűzések .................................................................................................... 12 2.2 Tartalom .......................................................................................................... 12 2.3 A tananyag kifejtése ........................................................................................ 12 2.3.1 Információkereső nyelvek a szabályozottság szerint .......................... 12 2.3.2 A természetes nyelven alapuló keresőnyelvek fejlődéstörténete ........ 15 2.3.3. Az uniterm rendszer és a kulcsszórendszerek .......................................... 16 2.3.4. A szabályozás céljai, szintjei, területei ............................................... 19 2.3.5. Példák a szabályozott és szabályozatlan elemek együttélésére ................ 21 2.4 Összefoglalás................................................................................................... 25 2.5 Önellenőrző kérdések ...................................................................................... 26 3. Indexelés. Kulcsszóindexek........................................................................................ 27 3.1 Célkitűzés ........................................................................................................ 27 3.2 Tartalom .......................................................................................................... 27 3.3 A tananyag kifejtése ........................................................................................ 28 3.3.1 Az index fogalma, ismérvei, tipizálási szempontjai ............................ 28 3.3.2 Az indexek típusai ............................................................................... 29 3.3.3 KWIC index ........................................................................................ 32 3.3.4. KWIC index alkalmazások ...................................................................... 34 3.3.5.KWOC index............................................................................................. 39 3.3.6 Automatikus indexek, internetes keresők ........................................... 41 3.4 Összefoglalás................................................................................................... 42 3.5 Önellenőrző kérdések ...................................................................................... 42 4. Indexelés: A PRECIS és a Hivatkozási index .......................................................... 43 4.1 Célkitűzés ........................................................................................................ 43 4.2 Tartalom .......................................................................................................... 43 4.3 A tananyag kifejtése ........................................................................................ 44 4.3.1 A PRECIS index alapjai ...................................................................... 44 4.3.2 A PRECIS szintaktikai szabályrendszere, indexelési szabályai .......... 44 4.3.3 A PRECIS összehasonlítása más indexekkel ...................................... 48 4.3.4 A PRECIS alkalmazása, használatának elterjedése ............................ 50 4.3.5 A Hivatkozási index alapjai ................................................................ 52 4.3.6 A hivatkozási indexben való keresés .................................................. 53 4.3.7 A hivatkozási index alkalmazási céljai, példái.................................... 56 5
4.4 4.5
4.3.8 A hivatkozási indexek fejlesztési irányai ............................................ 59 Összefoglalás................................................................................................... 60 Önellenőrző kérdések ...................................................................................... 60
5. A tárgyszavazás alapjai 1........................................................................................... 61 5.1 Célkitűzés ........................................................................................................ 61 5.2 Tartalom .......................................................................................................... 61 5.3 A tananyag kifejtése ........................................................................................ 62 5.3.1 A tárgyszavak rendszerbe foglalása .................................................... 62 5.3.2 A tárgyszavas keresőnyelvvel szembeni elvárások ............................. 66 5.3.3 Természetes nyelvből szabályozott tárgyszónyelv ............................. 66 5.3.4 A szótani szabályozás területei............................................................ 68 5.3.5 A jelentéstani szabályozás területei .................................................... 69 5.3.6 A tárgyszavak elrendezése .................................................................. 73 5.3.7 Szabályozás elvei és feltételei ............................................................. 73 5.4 Összefoglalás................................................................................................... 74 5.5 Önellenőrző kérdések ...................................................................................... 74 6. A tárgyszavazás alapjai 2........................................................................................... 76 6.1 Célkitűzés ........................................................................................................ 76 6.2 Tartalom .......................................................................................................... 76 6.3 A tananyag kifejtése ........................................................................................ 76 6.3.1 A tárgyszórendszerrel szemben követelmények ................................. 76 6.3.2. A tárgyszókategóriák .......................................................................... 77 6.3.3. A tárgyszavas indexelés és szabályozása ................................................. 80 6.3.4. Tárgyszavak előzetes vagy utólagos egymáshoz rendelése ................ 84 6.3.5. A fejlesztés öt alapkérdése .................................................................. 85 6.4 Összefoglalás................................................................................................... 86 6.5 Önellenőrző kérdések ...................................................................................... 87 7. Nemzetközi tárgyszórendszerek: LCSH, SWD/RSWK .......................................... 88 7.1 Célkitűzés ........................................................................................................ 88 7.2 Tartalom .......................................................................................................... 88 7.3 A tananyag kifejtése ........................................................................................ 89 7.3.1 A tárgyszórendszer fejlődéstörténete és jellemzői .............................. 89 7.3.2 A tárgyszórendszer részei, tárgyszóalakjai, tárgyszókategóriái .......... 89 7.3.3 A tárgyszókapcsolatok jelölése ........................................................... 91 7.3.4 Tárgyszóindexelési szabályok ............................................................. 94 7.3.5 A tárgyszórendszer fejlesztése ............................................................ 97 7.3.6 A tárgyszavazás fejlesztésének további nemzetközi példái ................ 99 7.4 Összefoglalás................................................................................................. 103 7.5 Önellenőrző kérdések .................................................................................... 103 8. Magyar tárgyszórendszerek .................................................................................... 105 8.1 Célkitűzés ...................................................................................................... 105 8.2 Tartalom ........................................................................................................ 105 8.3 A tananyag kifejtése ...................................................................................... 105
INFORMÁCIÓKERESŐ NYELVEK II. 8.3.1 Az Új Könyvek tárgyszójegyzék kifejlődése, fő ismérvei ................ 105 8.3.2 A tárgyszókategóriák ........................................................................ 110 8.3.3 Az indexelés szabályai ...................................................................... 111 8.3.4 Az UK tárgyszójegyzék és tárgyszavazás étékelése ......................... 112 8.3.5 A Kongresszusi Könyvtár-DEENK tárgyszórendszer fő ismérvei .. 113 8.3.6 További meghatározó fejlesztések .................................................... 116 8.3.7 A tárgyszórendszerek értékelési szempontjai ................................... 118 8.4 Összefoglalás................................................................................................. 119 8.5 Önellenőrző kérdések .................................................................................... 120 9. Információs tezauruszok - bevezetés ...................................................................... 121 9.1 Célkitűzés ...................................................................................................... 121 9.2 Tartalom ........................................................................................................ 121 9.3 A tananyag kifejtése ...................................................................................... 121 9.3.1 A tezaurusz helye a szabályozási spektrumban................................. 121 9.3.2 A tezaurusz szabványban meghatározott részei ................................ 124 9.3.3 A fő részt kiegészítő részek............................................................... 127 9.3.4 A tezaurusz értékelése, fejlesztése .................................................... 130 9.4 Összefoglalás................................................................................................. 130 9.5 Önellenőrző kérdések .................................................................................... 131 10. Magyarországi tezauruszok. A Könyvtári és tájékoztatási tezaurusz ................. 132 10.1 Célkitűzés ...................................................................................................... 132 10.2 Tartalom ........................................................................................................ 132 10.3 A tananyag kifejtése ...................................................................................... 133 10.3.1 A magyarországi tezaurusz-fejlesztések ........................................... 133 10.3.2 A Könyvtári és tájékoztatási tezaurusz (KTT) .................................. 135 10.3.3 A tezaurusz főrésze ........................................................................... 136 10.3.4 A tezaurusz kiegészítő részei ............................................................ 139 10.3.5 A tezaurusz alkalmazása a MANCI adatbázisban............................. 140 10.3.6 A KTT további alkalmazásai ............................................................ 143 10.4 Összefoglalás................................................................................................. 145 10.5 Önellenőrző kérdések .................................................................................... 145 11. Az OSZK-tezaurusz/Köztaurusz. Nemzetközi tezauruszok ................................. 147 11.1 Célkitűzés ...................................................................................................... 147 11.2 Tartalom ........................................................................................................ 147 11.3 A tananyag kifejtése ...................................................................................... 148 11.3.1 Az OSZK tezaurusz/Köztaurusz létrehozása és rendszere ................ 148 11.3.2 A lexikai egységek kategóriák szerinti bemutatása........................... 149 11.3.3 A tezauruszcikkek és szerkezetük ..................................................... 150 11.3.4 OSZK-tezaurusz/Köztaurusz alkalmazásai ....................................... 152 11.3.5 Nemzetközi tezauruszok ................................................................... 155 11.3.6 ERIC Thesaurus ................................................................................ 156 11.3.7 UNESCO tezaurusz........................................................................... 156 11.3.8. Magyar fejlesztési eredmények és távlatok ......................................... 159 11.3.9. Nemzetközi távlatok és ösztönzések .................................................... 161 7
11.4 Összefoglalás................................................................................................. 162 11.5 Önellenőrző kérdések .................................................................................... 163 12. Összefoglalás ............................................................................................................. 164 12.1 A kurzusban kitűzött célok összefoglalása.................................................... 164 12.2 Tartalmi összefoglalás ................................................................................... 164 12.3 A tananyagban tanultak részletes összefoglalása .......................................... 165 12.3.1 165 12.3.2 A természetes nyelveken alapuló keresőnyelvek .............................. 165 12.3.3 Indexelés. Kulcsszóindexek .............................................................. 166 12.3.4 A PRECIS és a Hivatkozási index .................................................... 166 12.3.5 A tárgyszavazás alapjai 1. ................................................................. 166 12.3.6 A tárgyszavazás alapjai 2. ................................................................. 167 12.3.7 Nemzetközi tárgyszórendszerek: LCSH, SWD/RSWK .................... 167 12.3.8 Magyar tárgyszórendszerek .............................................................. 168 12.3.9 Információs tezauruszok bevezetés ................................................... 168 12.3.10 Magyar tezauruszok. A Könyvtári és tájékoztatási tezaurusz ........... 168 12.3.11 Az OSZK-tezaurusz/Köztaurusz. Nemzetközi tezauruszok .............. 169 12.4 Egyéb ............................................................................................................ 169 13. Kiegészítések ............................................................................................................. 170 13.1 Irodalomjegyzék ............................................................................................ 170 14. Ábrajegyzék .............................................................................................................. 174 15. Médiaelemek ............................................................................................................. 175 16. Tesztek ....................................................................................................................... 176 16.1 Próbateszt ...................................................................................................... 176 16.2 Záróteszt A. ................................................................................................... 179 16.3 Záróteszt B. ................................................................................................... 182 16.4 Záróteszt C. ................................................................................................... 186
INFORMÁCIÓKERESŐ NYELVEK II.
1. BEVEZETÉS 1.1
CÉLKITŰZÉS (KURZUSRA)
A jegyzetünk az Információkereső nyelvek 1. kurzus anyagához kapcsolódik, és épít annak elsajátított ismereteire. Célunk, hogy segítsük Önt a természetes nyelven alapuló információkereső nyelvek fogalmi, elvi, módszertani, alkalmazási sajátosságainak megismerésében, a tanultak gyakorlati alkalmazásában. A tananyag egy részben hasonló szerkezetű, nyolc évvel ezelőtt készült jegyzetre épül. (Pálvölgyi Mihály: Információkereső nyelvek 2.) Annak szerkezeti keretébe dolgoztuk be az időközben bekövetkezett új fejleményeket, kutatásokat, fejlesztéseket, alkalmazásokat, annak érdekében, hogy ismeretei naprakészek legyenek. Mindenekelőtt a természetes nyelven alapuló információkereső nyelvek általános ismérveit kell megismernie, a szabályozatlanság/szabályozottság szemszögéből. Ennek ismeretére építve sajátítsa el egymást követő modulokban a kulcsszavazáson, tárgyi indexelésen, tárgyszavazáson és a tezauruszok alkalmazásán alapuló keresőnyelvek lényegi és specifikus ismérveit. Ismerje meg azok típusait, jellegzetes alkalmazási példáit. Fontos cél, hogy fejlessze ki magában a megismert keresőnyelvek gyakorlati alkalmazásához (távlatilag esetleg a fejlesztéséhez) szükséges készségeket. A jegyzet moduláris felépítésű, a tananyagot úgy osztottuk fel, hogy az egyes keresőnyelv-típusok elméleti, módszertani alapismereteinek megismerése mellett az azokra épülő konkrét keresőrendszerek működésébe is betekintést nyerjen, hogy a gyakorlatban alkalmazni tudja azokat. Az egyes leckéket úgy méreteztük, hogy képes legyen egyenletes tempóban haladni.
1.2
A KURZUS TARTALMA
1. Bevezetés 2. A természetes nyelveken alapuló keresőnyelvek 3. Indexelés. Kulcsszóindexek. 4. Indexelés. A PRECIS és a Hivatkozási index. 5. A tárgyszavazás alapjai 1. 6. A tárgyszavazás alapjai 2. 7. Nemzetközi tárgyszórendszerek: LCSH, SWD/RSWK 8. Magyar tárgyszórendszerek és fejlesztések 9. Információs tezauruszok – bevezetés 10. Magyar tezauruszok. A Könyvtári és Tájékoztatási Tezaurusz 11. Az OSZK Tezaurusz/Köztaurusz. Nemzetközi tezauruszok.
9
INFORMÁCIÓKERESŐ NYELVEK II.
1.3
A KURZUS TÖMÖR KIFEJTÉSE
A bevezetést követően, a modulárisan felépített tananyag 2. leckéjében a szabályozatlanság/szabályozottság spektrumból kiindulva megismeri a természetes nyelven alapuló keresőnyelvek fő típusait, azok ismérveit, fejlődéstörténetét és alkalmazásait. Az indexelés modul (3-4 lecke) először (a 3. leckében) az indexelés fogalmába, értelmezéseibe, majd típusaiba vezet be, melyet közvetlenül követ a részben automatizált kulcsszavas indexekkel (KWIC-index, KWOC-index), azok ismérveivel, készítésük és használatuk módszereivel, való ismerkedés, miközben értékeljük előnyös és hátrányos ismérveiket. A 4. leckében előbb a PRECIS-indexet ismeri meg, annak lényegét, az eredeti szövegek szövegösszefüggéseinek az indextételben a természetes nyelvi mondatokra emlékeztető ábrázolását. A hivatkozási index készítésének lényege, hogy elsősorban bibliográfiai eszközökkel nyomon kövesse, hogy a minőségi tudományos és szakmai publikációkban hogyan alakul a korábban megjelent kiadványokra való hivatkozás. Az erre épül indexrendszer révén megítélhető a szerzők tudományos publikációs tevékenysége, követhetővé válnak az egyes tudományterületek fejlesztési, fejlődési irányai. A tárgyszavazási modul (5–8. lecke) első két leckéje (az 5–6. lecke) abban segíti Önt, hogy világosan lássa a szabályozott tárgyszónyelvvel szembeni követelményeket, létrehozásuk, fejlesztésük elméleti-módszertani tudnivalóit. A 7. leckében a világszabványnak számító Kongresszusi Könyvtár tárgyszórendszerét, tárgyszavazási szabályait, illetve világméretű alkalmazásait, fejlesztési módszereit ismeri meg. A 8. leckében a magyar általános tárgyszórendszerek szabályozási megoldásairól kap részletes áttekintést (Új Könyvek tárgyszójegyzék, a Debreceni Egyetem Egyetemi és Nemzeti Könyvtár kétnyelvű (angolmagyar) tárgyszórendszere, tárgyszó-rendszerfejlesztési kérdések). A tezaurusz modul (9–11) első leckéjében először a tezaurusz fogalmát, összetevőit (főrész, kiegészítő részek), a kapcsolatok ábrázolásának módjait ismeri meg, majd a tezaurusz készítésének, szerkesztésének elméleti, módszertani tudnivalóit. A 10. leckében először a magyarországi tezauruszok fejlődéstörténetéről, a jelenleg épített tezauruszokról, majd az 1976 óta élő Könyvtári és tájékoztatási tezaurusz fejlesztéséről, szerkezetéről, kapcsolatjelölési módjairól, alkalmazásairól. A 11. leckében a legjelentősebb magyar tezaurusszal, az OSZK-tezaurusz/Köztaurusszal kapcsolatos tudnivalókat sajátítja el (szerkesztés, fogalmi kapcsolatok), majd az alkalmazásokba nyer betekintést. A nemzetközi webes tezauruszok közül az ERICtezauruszt, illetve az UNESCO tezauruszt ismeri meg közelebbről (szerkezetük, keresési alkalmazásaik). A lecke végén a tezaurusz és más információkereső nyelvek és rendszerek együttes elektronikus alkalmazási példáit, jövőbeli fejlesztési lehetőségeit tekintjük át.
1.4
KOMPETENCIÁK ÉS KÖVETELMÉNYEK
I. Ismeretek fejlesztése A természetes nyelven alapuló információkereső nyelvek (IKNY-ek, továbbiakban keresőnyelvek) típusai a szabályozottság/szabályozatlanság spektrum szerint. Az egyes típusok (szabadszavas, kulcsszavas, tárgyszavas, deszkriptoros) jellemzői, altípusai, fejlesztése, alkalmazása.
INFORMÁCIÓKERESŐ NYELVEK II. Képességek fejlesztése – az IKNY-ek egységes elvek szerinti elemzésének és használatának képessége (pl. újdonságfeltárás, a szövegösszefüggéseket megőrző indexelés képessége, a fejlesztési összefüggések feltárásának képessége). Készségek, jártasságok fejlesztése – a kurzus során megismert IKNY-ek szerinti tárgyi feltárásban jártasság szerzése, a keresési készség fejlesztése. Információfeltárási szerepkörök differenciált megismerése, szemlélete, értékelése– az egyes IKNY-ek előnyeire építve, különböző megoldások együttes alkalmazása a feltárás mélységi szintjein, az újító, fejlesztő szerepekkel való azonosulás. Énkép, önkép, önértékelés fejlesztése – a fentiek alapján nagyobb magabiztosság, önbizalom kialakítása a tárgyi feltárásban, majd a keresésben. Személyiségvonások tudatos fejlesztése -, különös tekintettel a sokszínű, sokrétű feltárás és keresés követelményeire (céltudatosság, kreativitás, adaptivitás, összpontosító képesség, rendezettség, kreativitás, csapatmunka) Motiváltság - az információfeltárás és keresés a legizgalmasabb, legnagyobb kihívást jelentő tevékenységek közé tartozik, s ebben a félévben is végig ezekhez kapcsolódó elméleti-módszertani és alkalmazási ismereteket sajátíthat el.
1.5
TANULÁSI TANÁCSOK, TUDNIVALÓK
Az Információkereső nyelvek tantárgy 2. féléve a természetes nyelvre épülő keresőnyelvekre összpontosít. Fontos, hogy a természetes nyelv adta lehetőségeket és korlátokat világosan és pontosan lássa. Csak a tisztánlátásra épülhetnek az ésszerű alkalmazások. Ehhez szükséges a vizsgált IKNY-modellek áttekintése, elemeik és az összefüggéseik feltárása, majd az adott modellre jellemző műveletek és típusok megismerése. A leckéket összefoglalás, ellenőrző kérdések és tesztkérdések zárják. A megadott hiperhivatkozások követése felfedezésre ad lehetőséget, a hivatkozott szövegekben érdekes, hasznos ismeretekre tehet szert, konkrét eseteket ismerhet meg. A kurzus a természetes nyelvekre épülő IKNY-ekre összpontosít, ami első hallásra megkönnyíti az elsajátítást. Ennek ellenére sajátos kihívást jelent a szabályozatlan keresőnyelvek, a kulcsszavak adta lehetőségek kihasználása, a szöveges ismertetés különböző formáinak (annotáció, referálás) művelése. A szabályozott IKNY-ek használata rendszerszemléletet, szabálykövetést, figyelmet, gondosságot, pontosságot igényel. A keresőrendszer akkor lehet hatékony, ha az elemei megfelelően kapcsolódnak egymással. A kurzus végén elengedhetetlen az elért eredmények értékelése, a megtapasztalt problémák, a további teendők számbavétele. Legyünk nyitottak az IKNY-ek közös alkalmazására és fejlesztésére! Kapcsolódó tantárgyak: Bibliográfiai adatfeldolgozás, Referátumkészítés, Az elektronikus dokumentumok feldolgozása, Integrált könyvtári rendszerek, Internetes keresőrendszerek működése.
11
INFORMÁCIÓKERESŐ NYELVEK II.
2. A TERMÉSZETES NYELVEKEN ALAPULÓ KERESŐNYELVEK 2.1
CÉLKITŰZÉSEK
A lecke feldolgozásával legyen képes az alábbiak értelmezésére, kifejtésére: – a természetes nyelven alapuló keresőnyelvek fogalma, típusai, – az újdonságfeltárás és a specifikusság problémája, – a természetes nyelv szerepe az információk leírásában, – a nyelvi szabályozás szükségessége és szintjei, – alkalmazási példák, előnyök, hátrányok, – a szabályozás területei és fokozatai.
2.2
TARTALOM
1.Információkereső nyelvek a szabályozottság szerint Szabályozatlan keresőnyelvek Szabályozott keresőnyelvek Átmeneti esetek 2. A természetes nyelven alapuló keresőnyelvek fejlődéstörténete Előretörésük okai és tényei A szabályozatlan keresőnyelvek térhódítása 3. Az uniterm-rendszer és a kulcsszórendszerek 4. A szabályozás céljai, szintjei, területei A szabályozás szükségessége, igénye, területei A nyelvi szabályozás céljai és szintjei Jelentéstani (szemantikai) szabályozás Szintaktikai szabályozás 5. Példák a szabályozatlan és szabályozott elemek együttélésére ERIC adatbázis szurrogátum példája ERIC adatbázis tezaurusztétel MANCI adatbázis bibliográfiai rekord példa HUMANUS adatbázis – új elem megjelenése tárgyi adatként A Pedagógiai Adatbázis: szurrogátum tárgyszavakkal és referátummal
2.3
A TANANYAG KIFEJTÉSE
2.3.1 Információkereső nyelvek a szabályozottság szerint Az információkereső nyelvek mesterséges, illetve természetes nyelveken alapulnak. A mesterséges nyelvek eleve szabályozott formában jönnek létre. A természetes nyelveken alapulók lehetnek (1) szabályozatlanok, illetve (2) szabályozottak. Hovatartozásukat a következő kérdésre adott válasz dönti el: „Honnan, milyen forrásból meríti a szavait az adott keresőnyelv?‖
INFORMÁCIÓKERESŐ NYELVEK II. Szabályozatlan keresőnyelvek Szabályozatlan (nem szabályozott) az a keresőnyelv, amelynek szavait a könyvtáros, a felhasználó, vagy a feldolgozó robot dokumentumok címéből, referátumából, szövegéből emeli ki változtatás nélkül és ilyen formában használja: a könyvtáros a feldolgozáshoz, a felhasználó a kereséshez, a feldolgozó robot pedig mindkettőhöz. Belátható, hogy a keresőnyelv szavai és kifejezései ebben az esetben a természetes nyelvből származnak. Ebbe a körbe tartoznak a világhálón tárolt szövegek, a szövegek szavai, szóösszetételei, mondatai (ahogy azokat a szerzőik megfogalmazták). Ezek mind internetes keresőkkel végzett keresés tárgyai lehetnek. A felhasználó oldaláról nézve a folyamatot (1) tudatosul benne valamely probléma, melyhez információkat kell keresni, (2) eszébe jutnak a problémát, kérdést kifejező szavak, (3) azokat bebillentyűzi a keresősorba. „Ez jutott eszembe, ezt keresem.‖ Általában nem használt keresőszótárt, maga fogalmazza meg a keresőkérdését, ahogy eszébe jut. Hogy az mennyire pontosan tükrözi igényét, problémáját, az más kérdés! Ez a kötetlen, szabadszavas keresés világa! A felhasználó feltételezi, reméli, vagy esetleg tudja, hogy mások is hasonlóan fogalmazták meg (hasonló szavakban, szóösszetételekben stb.) a problémát, amikor az arra vonatkozó információikat rögzítették, tehát azok a rögzített szövegekben előfordulhatnak. A legnagyobb találati esélye a konkrét létezőket, és dolgokat jelentő szavaknak van (személyek, intézmények, földrajzi helyek, dolgok nevei stb.) „Csak meg kell nevezni a dolgokat, a keresőszavakat bevinni, és máris jöhetnek a találatok‖. Csak tudni kell használni a nyelvet! A gondok ott kezdődnek, amikor a használt szavaknak többféle jelentése van, és ez a többféle minden ki is jön „találatként‖. (pl. index, kar, daru stb.) Az „átlag felhasználó‖ ritkán gondol arra, hogy körültekintőbben kellene megfogalmaznia keresőkérdését, és akkor kisebb lesz a „zaj‖, és pontosabb találatokhoz jut. A megfelelő szavak kombinálása sokat segíthet, de az emberek nagy része ritkán él ilyen „trükkökkel‖, nem használja az összetett keresés adta lehetőségeket. Nap mint nap tudatosulhat az emberekben, hogy a szabályozatlan keresőnyelvek használata nem vezet mennyországi állapotokhoz. Szükség lehet arra, hogy ne csak a „szavak szárnyán lovagoljunk‖, hanem fogalmakban, jelentésekben, összefüggésekben gondolkodjunk! Szabályozott keresőnyelvek „Ez jutott először eszembe. Utánanéztem egy értelmező szótárban. Megnéztem a pontos jelentését. Megnéztem, milyen hasonló jelentésű szavak vannak. Elgondolkodtam a kérdéses tárgy, személy, jelenség ismérvein és kapcsolatain. Megpróbáltam értelmezni, miről is van szó. Most már pontosabban tudom, hogy mit is akarok keresni‖. A könyvtárosok gondolkodásmódja ilyen. Hozzászoktak a szabályzatokhoz, a szabványokhoz, a módszeres megoldásokhoz. Szeretnek elgondolkodni a dolgokon, végiggondolni azokat, utánanézni azoknak, mielőtt elkezdenének a katalógusban, a weben, bármely keresőrendszerben kutatni. Jól kidolgozott, bevált, ellenőrzött, minőségi forrásokat keresnek és tanulmányoznak. Rendszeresen közelítik meg a kérdést, igyekeznek (körbe)járni a problémákat.
13
INFORMÁCIÓKERESŐ NYELVEK II. „Könnyű nekik‖, körül vannak véve osztályozási táblázatokkal, tezauruszokkal, szótárakkal, lexikonokkal. Ezek megmagyarázzák a szavak jelentését, összefüggésbe helyezik azokat, s így tudatosabban, pontosabban lehet természetes nyelven is keresni. A fogalmak összefüggnek, mindegyikről beugrik valami más, ami fontos lehet. A szabályozott, rendszerezett, rendezett körbe az információkereső nyelvek mellett még (1) a dokumentumtípusok, nyelvek, országnevek szabályozott kódjegyzékei, illetve a (2) a szerzői nevek, intézménynevek, földrajzi nevek szabályozott névjegyzékei (authority rekordjai). Ezeket könyvtárosok generációi dolgozták ki és fejlesztették azzal a szándékkal, hogy a valóság-fogalom-megnevezés háromszögben a megnevezés a fogalmat, a fogalom pedig a valóságo(ka)t tükrözze. Pl. Pozsony mint magyar város egy évezredig valóság volt, melyet rengeteg dokumentum, irodalmi mű idéz fel, igazol és bizonyít. Pressburg néven jórészt német közösség lakta. Pressborok néven az együtt élő szlovákság városa volt, majd Bratislava néven az államalkotó szlovákságé. Mindegyik történelmi korszak – valóság, melyhez rögzített dokumentumok sokasága kötődik. Hogyan nevezzem meg a várost, amikor korábbi történelmi korszakokra keresek? Melyik időszakra mely városnév használata az elfogadható és főleg valóságkövető? A dolgok és fogalmak és megnevezéseik kapcsolata a fentiekhez hasonlóan változik. Amikor a „computer‖ mint eszköz megjelent Magyarországon, sokáig a „computer‖ volt a megnevezése, majd a „kompjuter‖, a „komputer‖, és a „számológép‖, míg végül mintegy harminc éve elnyerte véglegesen (?) a „számítógép‖ elnevezést. Átmeneti esetek A nem szabályozott, illetve a szabályozott, elfogadott, kötelezően használt megnevezések között vannak átmenetek. A keresőnyelvek világában ezek közé tartoznak az új gazdasági, műszaki fogalmak megnevezései. Ezek a megnevezések még esetlegesek, viszonylagosak, az emberek „alig találnak rájuk szavakat‖, vagy ha igen, akár többet is, és egy ideig egyik használata se kizárólagos. A nemzetközi referáló adatbázisokban a bibliográfiai rekordokat és referátumokat tartalmazó szurrogátumokban gyakoriak ezek az „átmeneti vendégek‖. Angolul „identifier‖, magyarul hol „identifikátor‖ (az „identifier‖ mintájára), hol magyarítva „azonosító‖ a nevük, joggal, mert a fogalmakat azonosítani kell (ha csak ideiglenesen is.) Még nem kerültek be a szabványos, kontrollált, ellenőrzött szótárak „elit‖ tárgyszavainak klubjába, de már kijutottak a szövegszavak szürkeségéből, azonosító szavak lettek, részlegesen elfogadottak. A termékek és szolgáltatások típusai, a márkanevek esete is sajátos. Az erősen szabályozott tezauruszok világába nincs esélyük bekerülni, túl konkrétak ahhoz. Ugyanakkor bármely dokumentum tárgyai lehetnek (gondoljunk pl. a globális világválság által sújtott autók típusaira! Ezekre a tárgyakra is kell szavakat találni, ha informálódni akarunk róluk katalógusokban, adatbázisokban, az interneten.
INFORMÁCIÓKERESŐ NYELVEK II. 2.3.2 A természetes nyelven alapuló keresőnyelvek fejlődéstörténete Előretörésük okai és tényei A természetes nyelven alapuló keresőnyelvek úgyszólván a fű alól bújtak elő a 19. században. Addig szinte teljes mértékben a logikai alapon működő osztályozási rendszerek (szakrendszerek) uralták a terepet közel két és félezer éven át (Ninivei könyvtár, az Alexandriai könyvtár szakrendszere, a római szakrendszerek, a középkorban a hét szabad művészet szerinti szakrend, a Konrad Gesner „Bibliotheca Universalis‖ c. munkája alapjául szolgáló bibliográfiai szakrendszer. A természetes nyelven alapuló keresőnyelvek csak az újkortól tudnak kimutatni néhány „felmenőt‖ (a tárgyszavazás szórványos elméleti, módszertani előzményeit), majd szórványos 19. sz. eleji alkalmazásait (Martin Schrettinger). A természetes nyelven alapuló keresőnyelvek (akár szabályozatlanok, akár szabályozottak), családfája ily módon, a rendszeres, tömeges alkalmazásokat szem előtt tartva csak a 19. századig vezethető vissza. A megjelenés sorrendje is érdekes! − 1. Elsőként a tárgyszavak használata terjedt el tömegesen az 1870–90-as évektől (Charles A. Cutter elméleti-módszertani tevékenységének, illetve a Library of Congress =Kongresszusi Könyvtár) pragmatikus, célratörő rendszerfejlesztésének. A tárgyszavak használata ettől kezdve folytonos (az Egyesült Államokban). − 2. A kulcsszavak az 1920–30-as évektől kezdtek megjelenni a bibliográfiákban, majd referáló lapokban, a szöveges ismertetésekben. − 3. Az „uniterm-ek‖ az 1950-es évek elején arattak nagy sikert, mozgatták meg az „osztályozási állóvizet‖ az utólagos kombinálhatóságuknak (posztkoordinálás) köszönhetően. − 4. A félautomata „indexművek‖ az 1950-es évek végétől terjedtek, az elméletimódszertani megalapozást technikai fejlesztések követték. − 5. A tárgyszavak folytatták immár „világhódító‖ pályafutásukat, olyannyira, hogy az 1960-as években Magyarországon is egyre szélesebb körben váltak ismertté. (a szakkönyvtáraknak, illetve általánosságban az Új Könyvek állománygyarapítási tanácsadónak köszönhetően.) − 6. A tárgyszavaknak az 1960-as évektől, különösen az adatbázisokban, a tudományos és szakmai körökben veszélyes vetélytársai támadtak, a fogalmi összefüggéseket következetesen jelölő szakterületi tezauruszok, melyek a keresésben nagyobb pontossághoz vezettek. − 7. Az 1970-es évektől Magyarországon is növekvő számba készültek tezauruszok (Horváth Tibor, Vajda Erik, Ungváry Rudolf, Kövendi Dénes és mások jóvoltából). Ezek használata az adott szakterület szerint eltérően alakult, mint azt majd a 10. lecke lején látni fogjuk. − 8. Az informatikai fejlesztéseknek (tárolókapacitás növelése, miniatürizálás, nagyobb rugalmasságát biztosító szoftverek), a bibliográfiai leírási, és tárgyi feltárási szabványoknak, illetve az ezeket felhasználó adatbázisoknak köszönhetően a szurrogátumokban egyre természetesebben „férnek meg egymás mellett‖ a szabályo-
15
INFORMÁCIÓKERESŐ NYELVEK II. zott (tárgyszavas vagy tezaurusz-alapú), illetve szabályozatlan (kulcsszavas, szövegszavas) keresőnyelvek. − 9. Az 1980-90-es években egyre nagyobb teret kaptak az automatikus osztályozási és indexelési eljárások, az 1990-es években elkezdődött az internetes keresők diadalútja. − 10. A jelenlegi helyzetet kettősség jellemzi: – egyrészt a web 2.0 jóvoltából „mindenki szerző lett‖, mindenki feldolgoz és ír, és ehhez közösséget keres és talál, másrészt a tudományos és szakmai világban „az információban fuldokolva‖ még inkább erősödik az igény a nagyobb szabályozottság, a nagyobb pontosság, az öszszefüggések pontos ábrázolása iránt. Nem túl hosszú időszak a fentebb átfutott 120–140 év, a most élő idősebb embereknek a nagyapái még bőven beleférnek. Ez az időszak a természetes nyelvek - a „nyelvészeti irányzat‖ diadalútja volt az információk feltárásában, keresésében, akár szabályozott, akár szabályozatlan formában. A nyelv mindenkié, a nyelvet mindenki tudja használni, a nyelvvel mindenki tud élni! A kérdés csak az, hogyan? A szabályozatlan keresőnyelvek térhódítása A természetes nyelvek átfogó előretörését jelző fenti felsorolásban a szabályozatlan keresőnyelvek több helyütt is megjelennek (kulcsszavak, referátumok, uniterm, címszóindex, kulcsszóindex, automatizált indexelés). Térhódításuk a II. világháborút követően kezdődött, az 1950-es évek elején bontakozott ki, az alábbi tényezőknek köszönhetően: − (1) Információtechnika – a már a 19. század végén megjelent lyukkártyákat információkeresési célokra is használták, mind kézi, mind gépi formában, az 1950-es években pedig már egyre szélesebb körben jelent meg a számítástechnika. − (2) Terminológia – a tudományok és a technika gyorsuló üteme rengeteg újdonságot produkált a mindennapi környezetben, életmódban (új tárgyakat, dolgokat, folyamatokat, termékeket, szolgáltatásokat – nem csoda, hogy ugrásszerűen megnőtt szakmai terminológia jelentősége. − (3) Keresésmódszertan – az 1950-es években már tesztek, vizsgálatok mutatták ki, hogy a szabályozatlan természetes nyelven folyó keresés sokszor legalább olyan jó hatásfokú, mint az ellenőrzött szótárral segített rendszerekkel (pl. osztályozási rendszerekkel, tárgyszórendszerekkel) folyó keresés. Mindezek eredményeképpen a természetes nyelveken alapuló információkeresés kutatási-fejlesztési projektek tárgya lett, először az Amerikai Egyesült Államokban, majd más országokban is. 2.3.3. Az uniterm rendszer és a kulcsszórendszerek Az uniterm-rendszer Az uniterm-rendszert, s azon alapuló uniterm-kártya technológiát Mortiber Taube fejlesztette ki 1953-ban. Az „uni‖ azt jelenti, hogy egy, egyed, a „term‖ pedig azt, hogy terminus azaz szó, kifejezés. A fogalom meghatározásában két elemet hangsúlyozunk:
INFORMÁCIÓKERESŐ NYELVEK II. (1) Az uniterm olyan egyedi osztályozó, indexelő fogalom, mely már nem bontható tovább az értelme lényegi megváltozása nélkül, illetve az ezt kifejező indexelő szó, kifejezés. (2) Forrása az eredeti dokumentum, ahonnan kötetlenül, szabályozatlanul emelik be a keresőrendszerbe. Mortiber Taube abból indult ki, hogy a szerzők által az eredeti dokumentumokban használt szavak jól alkalmasak indexelésre és keresésre. A feldolgozás (indexelés) során minden összetett kifejezést egyedire bontottak le, pl. a környezetszennyezés-t környezetre és szennyezésre, a környezetvédelmet környezetre és védelemre stb. Az így létrehozott unitermeket (kettőt vagy akár többet is egyszerre) a keresés során szükség szerint kombinálták. →Az uniterm elvén működő rendszerek először lyukkártyákat használtak (ld. a mellékelt ábrán), e témakártyákon fizikailag jelölték meg a velük foglalkozó dokumentumok számát. A keresés során az adott téma (state police) leképezése szempontjából megfelelőnek ítélt uniterm kártyákat (pl. a mellékelt ábrán a „state‖, illetve a „police‖ kártyát) egymáshoz kellett rendelni, és az így keletkező „metszetekben‖ releváns dokumentumok jelenhettek meg találatként. Az ábra szerint a keresési feltételnek az alábbi számú és témájú tételek feleltek meg: 102 Arrest statistics of the Arizona State Police (Az arizonai állami rendőrség letartóztatási statisztikája, 107 A short history of the Wisconsin State Police (A wisconsin-i állami rendőrség rövid története), 115 The modern state police (A modern államrendőrség)1 Alábbi példánk azt mutatja, hogy „state‖, ill. „police‖ uniterm kártyák alkalmazásával Boole algebrai metszetet képezhetünk, mely egyezés esetén elvezet a „State police‖ fogalmát tartalmazó dokumentumok adataihoz.
1
Uniterm kártya Boole-algebrai metszete. URL: http:))hypatia.slis.hawaii.edu)~prototype)lis670)indexing)slide13.html
17
INFORMÁCIÓKERESŐ NYELVEK II.
1. kép
Uniterm kártya Boole algebrai metszete
Hamarosan azonban kiderültek a rendszer hiányosságai. Az „unitermizált‖ fogalmak utólagos egymáshoz illesztésekor komoly jelentésbeli problémák merültek fel. Pl. ha „New York‖ fogalmát az uniterm–elv alapján indexeléskor „New‖ és „York‖ unitermre bontották, a keresésnél a kettő kombinálásakor komoly „zaj‖ keletkezett. Nemcsak „New York‖ (az amerikai nagyváros), hanem az angliai „York‖ is megjelent „találatként‖, azok között az új („New „) épületeivel foglalkozó dokumentumok. A rendszer fejlesztői ekkor először (1) szerepjelölőket vezettek be, melyek rögzítették az ismérvek adott szerepét a tényálláson belül, majd (2) eleve egymáshoz kötötték („prekoordinálták‖) a problémát jelentő és a keresés során zajjal járó egyedi kifejezéseket. Végül Loll Rolling (Euratom) javaslatára az uniterm helyett (mellett) bevezették az uniconcept (egyedi fogalom) terminust is. Az alkalmazása sikeres lett: megtartották a szerzők szóhasználatának természetességét, ugyanakkor együtt kezelték a több szóval kifejezhető fogalmakat is. Az uniterm rendszer posztkoordináló elve ma is létezik, sőt ezt rendkívül széles körben használjuk, pl. az internetes keresők igénybevételekor, vagy pedig az önálló tárgyszavaknak a keresés során történő utólagos egymáshoz rendelésekor. A kulcsszórendszerek Az unitermet követően az 1950-es évek másik jelentős újítása Hans Peter Luhn KWICindexe volt. Luhn abból a feltételezésből indult ki – az 1950-es évek végén –, hogy − (1) a dokumentum eredeti szövegében előfordulnak azok a szavak és szószerkezetek (szintagmák), amelyek kifejezik a tartalmat, és alkalmasak annak leírására, − (2) a szavak előfordulásainak a száma, a gyakoriságuk és szignifikanciájuk között összefüggés van. (A szignifikancia a nyelvészetben azt jelenti, hogy „jelentéssel bíró‖, a mi esetünkben úgy fordíthatjuk, hogy „osztályozásra alkalmas‖.) − (3) ezeket a szavakat (kulcsszavakat) az egzakt tudományok esetében a közlemény címe is tartalmazza.
INFORMÁCIÓKERESŐ NYELVEK II. −
(4) A túl gyakran, illetve ritkán előforduló szavak alkalmatlanok a dokumentum osztályozására. (ilyen túl gyakori szavak pl. a névelők kötőszók, névutók stb. – a túl ritkán használt szavak pedig rendszerint egyéni szóhasználatot tükröznek, de nem jellemzik a mű tartalmát). Ezen a felismerésen alapul a KWIC-index (Key-Word-In-Context, a szövegkörnyezetes kulcsszóindex kifejlesztése, mely szintén Luhn nevéhez fűződik. Ez volt a szabályozatlan természetes nyelvek indexelésre és keresésre történő használatának igazi „nyitánya‖. A KWIC-index, vagy a KWOC-index kifejlesztése és alkalmazása lehetővé tette a keresőnyelvi szavak mind előzetes, mind utólagos egymáshoz rendelését is Teret hódított a posztkoordinált keresés, megjelent a számítógépes invertálás. (Lásd bővebben a következő leckében!) 2.3.4.
A szabályozás céljai, szintjei, területei A szabályozás szükségessége, igénye, területei
A szabályozatlan keresőnyelvek használatához rengeteg jelentésbeli, többértelműségi probléma társul, ami a megkövetelt „egyértelműség‖ ellen hat. − a homonimák (azonos szóalak- több jelentés pl. daru), − a szinonimák (több szóalak- azonos jelentés, pl. index - mutató) − a kváziszinonímák (több szóalak- hasonló, közel azonos jelentés, pl. Rózsa, tulipiros – Rózsa, élénk piros), − a nyelvi redundancia (túlcsordulás, terjengősség, ismétlések). Mindezt alátámasztják Csik Tibor és Varga Katalin vizsgálatai. Megállapítják, hogy bár a trendek a teljes szövegű adatbázisok terjedése felé mutatnak, ahol maga a szöveg adja a tartalmi keresés elemeit, a szabályozott listáknak és szótáraknak „még mindig‖ nagyon fontos a szerepe. A használók gyors és teljes információt akarnak, de ugyanakkor pontosat is. A kemény tudományok adatbázisaiban a legspecifikusabb és legpontosabb információs igényeket kell kiszolgálni. Még a teljes szövegű adatbázisok is szép számmal alkalmaznak szabályozott jegyzékeket.2 Terminológiai ellenőrzés nélkül a pontos keresés megoldhatatlan! A szabályozás területei Amennyiben a természetes nyelv szavait bizonyos szabályozásnak vetjük alá, szabályozott nyelvű információkereső nyelvet kapunk (röviden: keresőnyelvet). Ennek fontos ismérve, hogy benne rögzített szabályrendszerek határozzák meg − a szóalakokat és azok használatát = nyelvi-terminológiai szabályozás, − a homonimák, szinonimák kezelését, az osztályozási kifejezések egymás közti kapcsolatainak jelölését = jelentéstani szabályozás, − az IKNY-szavak keresőnyelvi mondatba (indextételbe) való szervezését = szintaktikai szabályozás.
2
CSIK Tibor, VARGA Katalin: A tudás és az információfeldolgozás = Tudományos és Műszaki Tájékoztatás, 52. évf. (2005) 7-8. sz. URL: http://tmt.omikk.bme.hu/show_news.html?id=4007&issue_id=464
19
INFORMÁCIÓKERESŐ NYELVEK II. A nyelvi szabályozás célja és szintjei A nyelvi szabályozás célja, hogy a keresőnyelv alaktani és jelentéstani szempontból egyaránt egyértelmű, következetes és tömör legyen (s ezzel kiküszöböljék a szabályozatlan természetes nyelv hátrányait (a többértelműséget, a következetlenséget és a redundanciát). A nyelvi szabályozás szintjére a következők jellemzők (1) összevonják a szóalakokat, egységesítik az írásmódot, (2) kiszűrik a homonimákat, értelmezővel látják el őket, (3) elemzik a szinonimákat, kiemelik a szinonimasor egyik elemét, és letiltják a többi elemet. A mellékelt táblázat (A redukció tárgya és következménye) mutatja, hogy a szófajokban, az esetekben, az egyes szám/többes szám használatban, a szinonimahasználatban kötetlen és túlcsorduló gazdag és színes természetes nyelvet hogyan vetik alá egy korlátozó alaktani szabályozásnak, (a szófaj, eset, egyes szám/többes szám, a szinonimák, a szóöszszetételek alkalmazási esetei terén.) (Ez a vadló és a lipicai ló esete?). 1.
A redukció tárgya és következménye
Eredménye tárgyszó általában csak főnév lehet általában alanyesetben használják egyes vagy többes számú alkalmazását előre meghatározzák 5 Szinonimák a szinonimáról a tárgyszóra utalnak, biztosítva a fogalom egyértelmű megnevezését 6 Szóösszetételek, összemeghatározzák, melyek tekinthetők egy keresőnyelvi tett szavak szónak, ill. hogy melyeket kell több szóra bontani (fogalomszervezési szint!) (*) (*) pl. Filozófiatörténet vagy Filozófia – Történet 1 2 3 4
Redukció tárgya Szófaj Eset Egyes/többes szám
A nyelvi szabályozás eredményeként kapott osztályozási kifejezések a tárgyszavak. A tárgyszavakat alkalmazó osztályozási rendszerekre számos elnevezést használnak (tárgyszavas osztályozási rendszerek, tárgyszórendszerek, tárgyszókatalógusok, tárgyszójegyzékek.) Ezek jelentése lényegében megegyezik, de elsősorban a rendszerességet jelző tárgyszórendszer kifejezést használjuk. A tárgyszórendszerek minimálisan a keresőnyelvi szavakat, az utalásokat és a hivatkozásokat tartalmazzák. Ezek azok a szabályozott (ellenőrzött, kötött) „tárgyszó-szótárak‖, melyeket a könyvtáros és a felhasználó egyaránt használ, s innen választja ki a szükséges tárgyszavakat akár a feldolgozás során, akár a keresés során. Jelentéstani (szemantikai) szabályozás A nyelvi szabályozáson túl az osztályozási kifejezések egymás közti kapcsolatait is meghatározzák és beépítik az információkereső nyelvekbe. A szabályozottsági elvárásokat tekintve a tárgyszórendszerekkel szemben viszonylag minimális feltételeket, míg az információs tezauruszokkal szemben igen szigorú feltételeket támasztanak, (mind nyelvi, mind logikai, mind pedig jelentéstani téren). A mindenre kiterjedő szabályozás eredményeként
INFORMÁCIÓKERESŐ NYELVEK II. kapott osztályozási kifejezés a deszkriptor (a describere latin szóból ered, melynek jelentése: leírni, jelölni). (Lásd példaként a jegyzetünkben több helyütt szereplő tezauruszcikkeket az OSZK-tezaurusz/Köztaurusz alapján.) Ugyancsak ide tartozik a jelentéstani szempontból gondot okozó homonimák és szinonimák kezelése. Szintaktikai szabályozás Az alaktani, szótani, jelentéstani szabályozás mellett egyes szabályozott rendszerekben nagy figyelmet fordítanak az információkereső nyelvi mondatok képzésére, a szintaxisra is. A tartalmat leképező egyes elemeket, – az ún. indexkifejezéseket – az eredeti szövegösszefüggések ábrázolására indextételbe szervezik. Az egyes rendszerekben az indexkifejezések sajátos mondattani szabályok szerint állnak össze indextétellé. Ilyen példákat láthatunk a 2.3.4 pont alatt mellékelt egy angol nyelvű, és két magyar nyelvű adatbázis példáiban. Az indextétel („információkereső nyelvi mondat‖) megalkotásához részletes folyamatábrát mutat be a Könyvtárosok kézikönyve, középpontjában a cselekvés, a dolgok és a folyamat körülményeinek, valamint az egyéb ismérveknek az elemzésével.3 Az indextételen belüli sorrendre vonatkozóan kétféle megoldás lehet: − Az indexkifejezések meghatározott szabályok és sorrend szerint a tárgyi feltárás során való egymáshoz rendelése (prekoordinálás), − az indexkifejezések utólagosan, a keresés során való egymáshoz rendelése (posztkoordinálás) (ld. Információkereső nyelvek, 1. félév, 7. lecke) Ez utóbbi megoldásnál az indexkifejezéseket egymástól függetlenül adják meg, és azokat a keresés során a felhasználó fogja igényei (előismeretei, tudása, tapasztalatai, stb.) szerint utólag egymáshoz rendelni. (Emlékeztető: gondoljon vissza az Egyetemes Tizedes Osztályozás során tanultakra, a jelzetelemek egymáshoz rendelésének a szabályaira, ill. Ranganathan Kettőspontos Osztályozás során a vetületek rendszerezett és módszeres alkalmazására. E félévben a KWIC-index, illetve PRECIS index esetében látni fogjuk, hogy az elemek előzetes egymáshoz rendeléséhez sajátos permutációs, illetve rotációs módszerek is társulnak. A tárgyszavazási példák közül amerikai, német és magyar példákat is megismerünk, pl. a Kongresszusi Könyvtár (Library of Congress) tárgyszórendszere, népszerű nevén az LCSH, a német SWD/RSWK, a magyar Új Könyvek tárgyszójegyzék. 2.3.5. Példák a szabályozott és szabályozatlan elemek együttélésére A továbbiakban példákat látunk arra vonatkozóan, hogy a szabályozatlan, illetve szabályozott keresőnyelvek együttes alkalmazása a szurrogátumokban milyen sajátos előnyökkel jár. Az a kielégítő állapot, ha mindkét típus kellő mértékben jelen van az információkereső rendszerekben (online katalógusokban, adatbázisokban, internetes katalógusokban, digitális könyvtárak keresőrendszereiben).
3
HORVÁTH Tibor, SÜTHEŐ Péter: A tartalmi feltárás. In: Könyvtárosok kézikönyve. 2. köt. Feltárás és visszakeresés. Bp. : Osiris, 2001.
21
INFORMÁCIÓKERESŐ NYELVEK II. ERIC-adatbázis szurrogátum példája Ez a csaknem ideális állapot számos adatbázisban már megvalósult „valóság‖. Az elemek jól végiggondolt ötvözete figyelhető meg az ERIC adatbázis4 egyik szurrogátumában. Láthatók: a bibliográfiai rekord szerves elemei, kereshető ismérvei: a cím, a szerző neve, a megjelenési adatok csoportjai, a kulcsszavak, a deszkriptorok, a rövid referátum (de a teljes is megjeleníthető lehet!), a kapcsolódó tételek, sőt a dokumentum elérhetőségére, beszerzésére vonatkozó információk is. (ld. 2. sz. melléklet)
2. kép
Egy szurrogátum az ERIC adatbázisból
ERIC adatbázis tezaurusztétel A szurrogátumhoz kapcsolódó tezaurusztétel az ERIC web portáljának tezauruszából származik,5 (3. sz. melléklet). Az elektronikus tanulásra (Electronic Learning) vonatkozik. A tezaurusztételben kilencféle adattípus jelenik meg: a rekordtípus, a megjegyzés, a kategóriajelölés, a fölérendelt fogalom, az alárendelt fogalom, a további kapcsolódó fogalmak, a szinonimák jelölése, a tezaurusztétel megjelenési dátuma, illetve azonosítószáma. Megfigyelhető, hogy az elmúlt félévben tanult asszociatív keresési modell, a „felfedezéses keresés‖ lehetősége itt is adott, hiszen a megadott deszkriptorok csatolóinak bármelyike igénybe vehető.
4 5
ERIC Educational Resources Information Center. URL: http://www.eric.ed.gov/ ERIC Educational Resources Information Center Web Portal. Thesaurus. URL: http://www.eric.ed.gov/ERICWebPortal/thesaurus/thesaurus.jsp
INFORMÁCIÓKERESŐ NYELVEK II.
3. kép
Egy tezauruszcikk az ERIC adatbázisból
MANCI adatbázis bibliográfiai rekord példa A MANCI adatbázisból vett bibliográfiai tételben (mely a szemantikus webről szól), szintén szerepet kapnak mind a szabályozott, mind a szabályozatlan elemek. (4. sz. melléklet). Itt a „szemantikus web‖ még „csak‖ a cím elemeként jelenik meg, nem ellenőrzött, szabályozott kifejezésként. Figyelemreméltók az alcím szavai is, melyek további fontos információkat hordoznak. A Könyvtári és tájékoztatási tezauruszból vett tárgyszavak a dokumentum tárgyát átfogó fogalmi szinten, több szempontból mutatják. Itt is egyértelmű, hogy a „felfedezéses keresés‖ lehetősége adott, akár a szerző neve, akár a tárgyszavak bármelyike szerint.
4. kép
Minden szurrogátumelem fontosságának példája
Az 5. sz. mellékletben ugyanezt a bibliográfiai rekordot látjuk másfajta megjelenítésben. Az elemek az előzőhöz képest rendezettebbek, jobban áttekinthetők. A bal oldali oszlopban jelzett 12 adattípushoz kapcsolódnak a jobb oldali oszlopban azok konkrét adatai. A „szemantikus web‖ itt is „csak‖ a cím elemeként jelenik meg. 23
INFORMÁCIÓKERESŐ NYELVEK II.
5. kép
A szurrogátumelemek rendszerezettsége, átláthatóságának példája
HUMANUS adatbázis: új elem megjelenése tárgyi adatként Az alábbi táblázatos formában bemutatott tételben a „szemantikus web‖ már nemcsak címszóként, hanem tárgyi kifejezésként is megjelenik, egy 2006. évi konferenciához kapcsolódó 2007. évi kiadvány feltárása kapcsán, immár a HUMANUS adatbázis 6keretében bemutatva. 2.
táblázat: a „szemantikus web” megjelenése tárgyi adatként
A tétel elemei Tóth Máté A szemantikus web : új lehetőségek és kihívások könyvtári környezetben / Tóth Máté. – Az Agria Media 2006 konferencián elhangzott előadás szerkesztett változata. – Bibliogr. In: Agria Media 2006 : „a digitális tanítási-tanulási környezet új tanári kompetenciákat és növekvő tanulási teljesítményt feltételez‖ : „digital teaching and learning environments require new teaching competences and increasing academic achievement‖ / [szerk. Tompa Klára, Nádasi András].. – Eger : EKF Líceum K., 2007, p. 151-157. Elektronikus könyvtár; Információkeresési rendszer; Számítógép-hálózat; Szakirodalmi szemle (forma); könyvtár 2.0; szemantikus web Lelőhely: B1, Raktári jelzet: MCQ 166.434
magyarázatok szerző leírási adatok
tárgyszó-adatok lelőhely, raktári adatok
A Pedagógiai Adatbázis : szurrogátum tárgyszavakkal és referátummal A záró példaként szereplő szurrogátum-melléklet a Pedagógiai Adatbázisból (PAD) származik. Két szempontból is tanulságos:
6
HUMANUS adatbázis. URL: http://humanus.bibl.u-szeged.hu/human/cikk-mokka
INFORMÁCIÓKERESŐ NYELVEK II. −
−
jól látható, hogy a szabályozott indexkifejezések (tárgyszavak), illetve a kötetben felvetett kérdéseket érzékletesen bemutató szöveges ismertetés (referátum) egymást erősítve segítenek abban, hogy a dokumentumban levő tartalom üzenetét megérthessük. A tárgyszavakon belül három markáns csoport figyelhető meg (1) a tárgyitechnikai vonatkozó tárgyszavak (számítógép, informatika, információs hálózat, internet), (2) a cselekvéssel kapcsolatos tárgyszavak (oktatás, tanulás, távoktatás, pedagógusképzés), (3) a helyhatározónak tekinthető Franciaország. Mindez egy kibővített természetes nyelvű mondatra emlékeztet, aminek titkát majd PRECIS relációmegőrző indexelési rendszer tárgyalásánál fejtjük meg (4. lecke).
Cím és szerző: Folyóirat: Megjelenés: Terjedelem: Nyelv: Tárgyszavak:
L'Odyssée des réseaux ( Coord. par Alain Jaillet et al. Cahiers Pédagogiques 2001. No396. 11-53.p. 43 Fre számítógép ; informatika ; információs hálózat ; internet ; oktatás ; tanulás ; távoktatás ; pedagógusképzés Franciaország Szakcsoport: 521.1, 521.4 Referátum: Az információs hálózatok, az új technológiák bekerültek az iskola mindennapi gyakorlatába. Hogyan használják a pedagógusok az internetet az egymás közötti kommunikáláshoz, a képzésükhöz, a tapasztalatcseréhez? Hogyan alkalmazzák az osztályban, a mindennapi tanítási gyakorlatban? A tanulók iskolán kívüli tevékenységeikben milyen szerepet játszik az internet? A hálózatok segítenek a tanulásban? Az internet nem csodaeszköz, az internet hathatós eszköze lehet az oktatásnak, de nem feltétel nélkül. Az összeállítás három témakört érint, 1. a pedagógusközösségek és az iskolai közösségek észrevételei, elképzelései és véleményei a hálózatok iskolai szerepéről és jövőjéről, 2. amit megváltoztatnak az oktatásban, 3. ahogy segítenek a tanulásban. Raktári jelzet: 710.057 Leltári szám: C543 01 396 11 L'Odyssée 6. kép Szurrogátum tárgyszavakkal és referátummal Pedagógiai Adatbázisból
2.4
ÖSSZEFOGLALÁS
A természetes nyelvre épülő keresőnyelvekkel tárgyunk első félévének 7. leckéjében Ön már tudatosította, hogy azok a nyelvészeti és statisztikai irányzathoz kapcsolódnak. Azt is tudatosíthatta, hogy a mesterséges hierarchikus osztályozási rendszerektől eltérő elvek és megoldások szerint szerveződnek és működnek. Leckénkben a sokféle tipizálási lehetőség közül a szabályozatlanság/szabályozottság ellentétpárra helyeztük a hangsúlyt, ennek fogalmi tisztázásával kezdtünk. Ezt követően a szabályozatlan keresőnyelvek történetileg
25
INFORMÁCIÓKERESŐ NYELVEK II. fontos újításaival ismerkedett meg (uniterm, kulcsszórendszerek, internetes keresőrendszerek). A mindennapi nyelvhasználatra épülő szabályozatlan keresőnyelvek nem vezetnek paradicsomi állapotokhoz! Elismerve előnyeiket, a hátrányos tulajdonságaik számbavétele alapján világossá vált, hogy a pontosabb, egyértelműbb keresés érdekében elengedhetetlen a szabályozás. A zárófejezetben ezért részletesen megismerte a szabályozás indítékait, céljait, területeit (szókincs, alaktan, jelentéstan, mondatalkotás) és szintjeit. A lecke áttanulmányozásával részletes áttekintéssel rendelkezik a természetes keresőnyelvek két fenti típusának előnyeiről és hátrányairól. A leckében tárgyalt témák kapcsolatai más tárgyakkal: Bibliográfiai adatfeldolgozás, Számítógépes hálózatok, Integrált könyvtári rendszerek
2.5
ÖNELLENŐRZŐ KÉRDÉSEK
1.
Értelmezze a szabályozatlan nyelv fogalmát!
2.
Értelmezze a szabályozatlan IKNY-ek fejlődéstörténetének fő állomásait!
3.
Mutassa be, melyek az előnyei a szabályozatlan nyelveknek!
4.
Mutassa be, melyek a hátrányai a szabályozatlan nyelveknek!
5.
Miben látja az uniterm rendszer osztályozáselméleti jelentőségét?
6.
Hasonlítsa össze a szabályozatlan és szabályozott nyelveket a pontosság szempontjából!
7.
Fejtse ki a nyelvi szabályozás fő céljait és szintjeit!
8.
Fejtse ki a szintaktikai szabályozás lényegét!
9.
Mi a véleménye a szabályozatlan és szabályozott elemek egyensúlyáról a szurrogátumokban?
10. Melyik szurrogátumot találta a legmeggyőzőbbnek az előző ponthoz kapcso-
lódva?
INFORMÁCIÓKERESŐ NYELVEK II.
3. INDEXELÉS. KULCSSZÓINDEXEK 3.1
CÉLKITŰZÉS
Legyen képes az alábbiak értelmezésére, kifejtésére – az index és indexelés fogalma, – az indexelés osztályozáson belüli helye, szerepe, – az indexek alkalmazási területei és lehetőségei, – az egyes indextípusok (kulcsszavas indexek, PRECIS, hivatkozási index) sajátos ismérvei. Legyen képes az alábbi alkalmazásokra – a kulcsszóindexek készítése első lépéséhez szükséges intellektuális munka elvégzése, – a kulcsszóindexekben való keresés, – a hivatkozási indexben való keresés, – a mondatszerűség alkalmazása indextétel összeállításában.
3.2
TARTALOM
1. Az index fogalma, ismérvei, tipizálási szempontjai – Az index fogalma, jelentései – Osztályozás és indexelés összefüggései 2. Az indexek típusai – Indexek a kereshető ismérvek szerint – Indexek az automatizálás mértéke szerint – Indexek a nyelv szabályozottsága szerint – Indexek az automatizálás/szabályozottság együttes szempontja szerint 3. KWIC-index – A KWIC index fogalma, ismérvei – Címszavak, kulcsszavak, szövegszavak – KWIC indextétel szerkezete – Az indexkészítés lépései 4. KWIC index alkalmazások – Könyvtári információs alkalmazások – Szövegkonkordancia alkalmazások 5. KWOC index – A KWOC indextétel formája – Az index alkalmazása – A KWOC index értékelése 6. Automatikus indexek, internetes keresőrendszerek
27
INFORMÁCIÓKERESŐ NYELVEK II.
3.3
A TANANYAG KIFEJTÉSE
3.3.1 Az index fogalma, ismérvei, tipizálási szempontjai
Az index fogalma, jelentései A latin eredetű „index‖ szó „számtalan‖ jelentése közül néhányat mutatunk be, szemléltetve a természetes nyelvű kifejezések sokféle jelentését (poliszémiáját): általános értelemben mutató, konkrétan főiskolai leckekönyv, járműn irányjelző kar vagy villogó lámpa, tiltott könyvek jegyzéke, név-, tárgy-, és szómutató stb. Az index „számtalan‖ jelentéséből nézzük meg, hogy az információfeldolgozásban, tartalmi feltárásban melyek a leginkább alkalmazottak! − a dokumentumban, tájékoztató kiadványokban (könyvek, repertóriumok, bibliográfiák) való keresést szolgáló szerzői, személy-, testületi, tárgyi, földrajzi hely- stb. indexek, − melyek az indexelés folyamatainak elvégzésével jönnek létre. Az index könyvtári információs meghatározása Könyvtári információs alkalmazásokban az indexek – különböző osztályozási műveletek végtermékei, a dokumentum tartalmát és egyéb jellemzőit leíró szóláncok – indextételek – rendezett gyűjteményei.7 Az indexek építőegységei a természetes nyelvekből erednek (szavak, szóláncok, szókombinációk). Az indexelés révén születnek a különféle ismérvek (szerzői nevek, címek, tartalomra utaló szavak, testületi nevek, kiadók nevei, ISBN, földrajzi nevek stb.) szerinti rendezett jegyzékek. A rendezett ismérvek jelölése nyelvi eszközökkel történik, melyek eredményeképpen a feltárt dokumentumok (ismeretegységek) visszakereshetők. Osztályozás és indexelés összefüggései A tudás tartalmi reprezentálására a legszélesebb körben használt eszközeink a 19. században születtek (és a 20. században bontakoztak ki):8 (1) Tudományfelosztáson alapuló osztályozási rendszerek: A felosztás mögött valamilyen tudományrendszertan áll, amelynek alapja filozófiai vagy „általánosan elfogadott‖ gyakorlat lehet. Az ismeretkörökön belül az osztályok, alosztályok stb. kialakítása logikai alapokon történik (alá-fölé rendeltség, egész-rész viszony). A felosztás szempontját adó lényeges megkülönböztető jegy (megkülönböztető ismérv, differentia specifica) azonban relatív, s egyetlen hierarchikus rendszer sem lehet mentes a következetlenségektől, ellentmondásoktól. Az osztályozó ismérveket általában kódokkal is megjelölik, ami mutatja a hierarchiában elfoglalt helyet. (2) Természetes nyelven alapuló „tárgyszavas‖ vagy indexelő eljárások:
7 8
KÖRNYEI Márta: Könyvtári osztályozás 1. köt. Bp.: Tankönyvkiadó, 1990. Csík Tibor – Varga Katalin: A tudás és az információfeldolgozás. Tudományos és Műszaki Tájékoztatás. 52. évfolyam (2005) 7-8. szám http://tmt.omikk.bme.hu/show_news.html?id=4007&issue_id=464
INFORMÁCIÓKERESŐ NYELVEK II. Az ismérvek egyértelmű jelölése a kulcstényező – a nyelvi sokszínűségből eredő bizonytalanságokat ki kell küszöbölni (homonímia, szinonímia stb.). A téma egyediségének, újdonságának felmutatására lehetőséget ad. Az ismérvek összefüggéseinek (tematikai, logikai) jelzésére a szótárban kiépített utalórendszer szolgál. (3) Szöveges ismertetők, tartalmi összefoglalók (annotáció, kivonat, referátum stb.): Tartalmi és formai problémákkal egyaránt számolni kell. Az osztályozás és az indexelés egymás mellett élő eljárások, amelyek kölcsönösen függnek egymástól és kiegészítik egymást. Az indexelés, indextétel, indexkifejezés összefüggései − Az indexelés alapegysége az indexkifejezés (pl. szövegszó, kulcsszó, tárgyszó, deszkriptor), mely a leképezett (reprezentált) ismeretegységnek valamely lényegesnek tekintett ismérvét adja meg, de „csak‖ valamely oldalát. − Folyamatként felfogva: az indexelés – egy feldolgozási egység (dokumentum, ismeretegység stb.) tartalmának meghatározott megközelítés szerinti reprezentálása az indexkifejezésekkel. − A folyamat eredménye: indextétel – az adott feldolgozási egységre adott indexkifejezések összessége, mely valamilyen szempontrendszer szerint együttesen képviseli az ismérvek, szövegösszefüggések összességét. Az indexek tipizálási szempontjai Az indexeknek a fentiekből következően sokféle típusa és alkalmazása van. Az alábbiak szerint csoportosítók: − (1) a kereshető ismérvek köre szerint − (2) az alkalmazott nyelv szabályozottsága/szabályozatlansága szerint − (3) az automatizáltság mértéke szerint 3.3.2 Az indexek típusai Indexek a kereshető ismérvek szerint A indexek praktikus felosztása azon alapul, hogy mely ismérvek kereshetőségét,, böngészhetőségét teszi lehetővé. E megközelítés szerint az indexek úgy keletkeznek, hogy a dokumentumok egyik vagy másik megkülönböztetett ismérvéhez tartozó egyedeket valamilyen szempont szerint rendezzük, rendszerezzük és kereshetővé tesszük. 3.
Ismérv típusa Szerző Szerző munkahelye Dokumentum címe ISBN-szám
Az indexek jellemző ismérvei:
Index típusa szerzői index testületi index címindex (lényegét tekintve ez is a tartalomra utal) ISBN-mutató 29
INFORMÁCIÓKERESŐ NYELVEK II. Dokumentum tartalma Dokumentum műfaja Kongresszus adatai a kongreszszusi kiadványokban Kémiai képlet Dokumentumban szereplő bibliográfiai hivatkozások
tárgyszóindex, deszkriptorindex, kulcsszóindex műfaj szerinti index a kongresszus ideje, helye, rendezője, finanszírozó testülete szerinti kémiai képlet mutató hivatkozási index
A felsoroltakon kívül az informatika lehetőségek fejlődése további ismérvek (pl. kiadó, nyelv stb.) indexeinek generálására és azok szerinti keresésre ad lehetőséget. A modern adatbázisokban (pl. Thomson Scientific, PROQUEST Dialog), kiemelten fontos az indexek (szükség szerint kombinált) használata a keresés pontosságának fokozása érdekében. Vannak adatbázisok, amelyben az igénybe vehető indexek száma meghaladja a 30-at. Az online katalógusokban a létrehozott indexek mind az egyes ismérvek, mind pedig azok kombinációi szerinti összetett kereséskor alkalmazhatók. Fontos alkalmazásuk a böngészés elősegítésére, amikor nem tudjuk teljesen pontosan, hogyan is keressünk, de a megfelelő helyeken belépve a tárgyi, szerzői stb. indexbe, segítséget kaphatunk a kívánt tételek megtalálásában. A könyvtári rendszerek szolgáltatói (pl. Aleph, HunTéka stb.) kínálatában vannak eltérések, de összességében a nagy számú indexválasztékkal szolgálják mind a keresési, mind a böngészési célokat. (A teljesség kedvéért jegyezzük meg, hogy további sajátos szempontok is vannak, pl. az adatfeltárás időspektruma szerint – kurrens vagy retrospektív index) Indexek az automatizálás mértéke szerint Az indexek az automatizálás mértéke szerint lehetnek: kézi indexek és gépi indexek. 4.
Az index típusa Kézi indexek Gépi indexek
Előállítás manuális, nagy idő- és munkaigény gépi, kisebb időigény, automatizált vagy félig automatizált
A kézi és gépi indexek jellemzői
Példák könyvindexek, pl. szerzői, tárgymutató címindex, tárgyszóindex, hivatkozási index
A gépi indexek közül egyesek némi intellektuális előkészítés után készülnek számítógéppel (KWIC-indexek), míg mások előre elkészített programok szerint eleve azzal. (automatikus indexek).
INFORMÁCIÓKERESŐ NYELVEK II. Indexek a nyelv szabályozottsága szerint 5.
Az index tipusa Kulcsszóindexek Címindexek/ Tárgyszóindexek tárgyi indexek/
Az indexek a nyelv szabályozottsága szerint
A szabályozottság mikéntje szabályozatlan szabályozott
Példák KWIC-index, KWOC-index Permutált tárgyi index, PRECIS-index
A gépi indexelésnek fontos ismérve, hogy az indextétel összeállításához szükséges indexkifejezéseket honnan nyerik: − közvetlenül a dokumentum címéből, szövegéből vagy referátumának szavaiból ekkor az indextétel a kiválasztott szabályozatlan természetes indexkifejezések halmaza, célnak és funkciónak megfelelően tetszés szerinti számban és mellérendelő módon. − közvetve valamely szabványosított szótárból (tárgyszójegyzékből, tezauruszból stb.) – ekkor az indextétel a kiválasztott szabályozott tárgyszavak, illetve deszkriptorok koordinált sorozata, amely a dokumentum lelőhelyét és bibliográfiai adatait stb. jelzi, azokra mutat, azokhoz irányít. Indexek az automatizálás/szabályozott együttes szempontja szerint Darányi Sándor alapján tárjuk fel ezek ismérveit:9 Szabályozatlan szókinccsel dolgozó gépi indexek − Címindexek – a dokumentum tartalmának leírására az eredeti címből, a módosított vagy kiegészített címből, esetleg a mesterségesen alkotott címből származó kulcsszavakat használnak. − Kulcsszóindexek – a kulcsszó kiválasztáshoz nemcsak a címet, hanem az egész szöveget feldolgozzák. Szabályozott szókinccsel dolgozó gépi indexek Ide tartoznak a tárgyi, vagy tárgyszóindexek, melyek fő ismérvei: − Szabályozott szókészletet kezelnek. − Némileg hasonlítanak a címindexekhez, ám a tárgyszóláncok megalkotása egyrészt komoly intellektuális tevékenység, másrészt reduktivabb; nem tartalmazza a töltelékszavakat − A számítógép kész tárgyszóláncokat kap; ennek alapján állítja elő a tárgyi indexet. − Tárgyi indexek az előállítás módja szerint 9
DARÁNYI Sándor: Osztályozási rendszerek, információkereső nyelvek I. Szeged: SZTE BTK Könyvtártudományi Tanszék, é.n. URL: http://www.bibl.u-szeged.hu/inf/kurzus/alapkepzes/osztalyozas-1.pdf
31
INFORMÁCIÓKERESŐ NYELVEK II. Az előállítás szabályozása, módja szerint a tárgyi indexek lehetnek sima permutált tárgyi indexek, illetve lánceljárásos tárgyi indexek. Sima permutált tárgyszóindex Az indexelő a fontos tárgyszavakat a lánc elemeiként, egyedként fogja fel; a gép ciklikusan permutálja, majd első tagjuk szerint betűrendbe rakja. Példa: Eredeti lánc: Magyar. Líra. Romantika. Hasonlat. A ciklikus permutáció és a betűrendezés után: − Hasonlat. Magyar. Líra. Romantika − Líra. Romantika. Hasonlat. Magyar − Magyar. Líra. Romantika. Hasonlat − Romantika. Hasonlat. Magyar. Líra Lánceljárásos permutált tárgyszó index: a tárgyszavakat nem önálló, nem különálló elemekként kezeli, hanem a specifikustól generikusig rendezve a tárgyszóláncon belül, fogalmi szinteket jelez. Példa: − Hasonlat. Romantika. Magyar. Líra − Romantika. Magyar. Líra − Magyar. Líra − Líra 3.3.3 KWIC index A KWIC index fogalma, ismérvei A KWIC-index módszerének bevezetéséről az előző fejezetben már szóltunk. Itt elkezdjük ismérveinek, alapelveinek, módszereinek alkalmazásainak rendszeres kifejtését. Hans Peter Luhn 1958-ban dolgozta ki a módszert, és 1960-ban tette közzé az IBM megbízásából. A KWIC betűszó jelentése: KeyWord-In-Context, azaz kulcsszó szövegösszefüggésben (vagy más szóval: szövegkörnyezetben). Jegyezzük meg, hogy egy kulcsszó sohasem áll önállóan, hanem szövegösszefüggésében, más kulcsszavak „társaságában‖. Leglényegesebb ismérve, hogy használata esetén közvetlenül a dokumentum címéből, szövegéből vagy referátumának szavaiból választjuk ki az osztályozási kifejezést /IKNYszavakat/, tetszés szerinti számban és mellérendelő módon. Címszavak, kulcsszavak, szövegszavak Címszó: a cím valamely szava, amely tartalomhordozó is lehet. Kulcsszó: a címben, illetve a szövegben, annak különféle funkcionális egységeiben található tartalomhordozó szó. Magában foglalhatja szurrogátum szövegében – a bibliográfiai leírás egyes elemeiben, valamint a referátumban található szavakat is. Szövegszó – a szövegben, vagy annak részeiben található szó. Adott esetben, adott felhasználók számára kulcsszóként értelmezhető.
INFORMÁCIÓKERESŐ NYELVEK II. Varga Katalin szerint, ha a cím megfogalmazza a szöveg egészét átfogó témát, megadja a kiindulópontot a szövegjelentés elemzéséhez is. A cím ily módon a globális kohézió egyik leghatékonyabb eszköze lehet, különösen tudományos szövegek esetében. A címadás célja általában azonosítás vagy figyelemfelkeltés. Az utóbbi motívum hatására, gyakran nem egyértelműen, a téma megjelölésére törekszik a cím adója, hanem inkább az érdeklődés felébresztésére.10 KWIC indextétel szerkezete A KWIC index logikája egy indextétel példáján: Legyen az indextétel: Az online könyvtári katalógusok /OPAC/ és a természetes nyelvű információ-keresés‖ Ebből az indextételből kulcsszónak tekinthetők a következők: online, könyvtári, katalógus, OPAC, természetes, információkeresés A többi szó – esetünkben – töltelékszónak számít: Az, és, a, nyelvű A fenti indextétellel kapcsolatban két kritériumot fogalmazunk meg: (1) minden egyes kulcsszó szerint lehessen keresni, (2) a kulcsszavak maradjanak szövegkörnyezetben. Mindez a ciklikus permutációs indexeléssel valósítható meg: Nézzük meg a mellékletben szereplő példát a ciklikusan permutált indextételre!
7. kép
10
KWIC indextételek a Tudományos és Műszaki Tájékoztatás éves tartalomjegyzékéből
Varga Katalin: Szöveg és tartalom az információs társadalomban: módszerek és lehetőségek az információ minőségi szelektálására. [közreadja a] Pécsi Tudományegyetem Felnőttképzési és Emberi Erőforrás Fejlesztési Kar. Pécs : PTE FEEK, 2005.
33
INFORMÁCIÓKERESŐ NYELVEK II. A mellékelt példában jól követhetők a számokkal jelzett funkcionális szerkezeti elemek. (1) a kulcsszó a keresőoszlopban, (2) a kulcsszót követő szövegkörnyezet (3) a szövegkörnyezet folytatása, (4) a dokumentum-azonosító adatai. Megj.: a kulcsszavas indextételben, mint láthatjuk, meghagyják az annak „természetes csengést‖ adó névelőket, kötőszavakat, számneveket, valamint egyéb, nem kulcsszónak minősülő főneveket. Ezek osztályozásra alkalmatlan szavak, nem kulcsszavak, tehát nem keresőszavak. Amikor a gép permutálja (megforgatja) az indextételt, hogy minden egyes kulcsszó keresőpozícióba (azaz a keresőoszlopba) kerüljön, e töltelékszavak egy letiltó lista (ún. stoplista) alapján kizáródnak ebből a lehetőségből. Az indexkészítés lépései A KWIC index készítése során alapvető követelmény, hogy az indextétel megfelelő számban és módon tartalmazza a dokumentumtartalmakat tükröző kulcsszavakat, hogy azok megfelelően jelenjenek meg a szövegkörnyezetben. 1. lépés: a „nyers címet‖, a dokumentum eredeti címét kell megvizsgálni abból a szempontból, hogy milyen mértékben felel meg a fenti követelménynek. A cím szavai a szerző szándéka szerint általában fontos kulcsszavakat tartalmazhatnak. A címek kifejezőek, konkrétak, tükrözik a specifikus információtartalmat, különösen a műszaki/tudományos folyóiratokban. De nem mindig van így. Nézzünk meg erre egy példát! Egy megjelent dokumentum címe (alcím nélkül!): „Útban a tudástársadalom felé.” Talán figyelemfelkeltő, de sablonos, semmitmondó. Fontos, hogy a címen túl tájékozódjunk a bevezetésben, tartalomjegyzékben, összegzésben is stb. Ha szükséges, át kell fogalmazni a címet. Esetünkben az indextétel a következő lesz: A tudástársadalomra való felkészülés stratégiái és programjai az Európai Unióban. 2. lépés: az előkészített indextételt a számítógép a benne levő kulcsszavak szerint ciklikusan megforgatja (permutálja), hogy mindegyik kulcsszó egyszer bekerüljön a keresőoszlopba, majd az összes tételt betűrendbe rendezi. A permutálás következtében, ugyanannak a tételnek különféle változatai jönnek létre. A kulcsszavak minden esetben a szövegkörnyezetben szerepelnek. Az indexsorok karakterszáma korlátozott, ezért gyakran fordulnak elő csonka címek, „leharapott‖, szétvágott szavak. A számítógépes rendezés és kiírás során a gép mechanikusan vágja el a címet a rendelkezésre álló pozíciók végén. 3.3.4. KWIC index alkalmazások Az alkalmazások két nagy körét mutatjuk be: (1) könyvtári-információs alkalmazások (OMIKK TMT indexek, illetve Dialog szolgáltatási példa), (2) szövegkonkordanciaalkalmazások Könyvtári információs alkalmazások OMIKK TMT indexek Magyarországon a BME–OMIKK (és egyik elődje: az Országos Műszaki Információs Központ és Könyvtár) szerepét kell hangsúlyozni, mely indexelő kiadványaival, illetve a
INFORMÁCIÓKERESŐ NYELVEK II. Tudományos és Műszaki Tájékoztatás (TMT) éves indexének kiadásával szolgálta/szolgálja a tájékoztató munkát. A könyvtári- tájékoztatási szolgáltatások között már az 1960-as évektől jelentettek meg KWIC-indexeket, köszönhetően a viszonylag kis munka- és költségigényének, gyors elkészíthetőségének. Igen népszerű volt pl. az Új kutatási és műszaki fejlesztési jelentések az Országos Műszaki Könyvtárban. Bibliográfia és index. E KWIC-indexek általában egy teljes tájékoztató kiadvány részét képezték a bibliográfiai főrész után, a szerzői és egyéb mutatók társaságában. A mutatók tételeitől a hivatkozási adatok vezettek el a bibliográfia megfelelő részeihez, ahol a teljes leírást megtalálhatták. (Más intézmények hasonló indexei, pl. az Építésügyi Tájékoztatási Központ Építéstervezés – Gyorsindexe (KWIC-indexe) is népszerűek voltak. Ma már ezek nem készülnek. Helyüket jó esetben adatbázisok vették át. Egyes indexek a folyamatos (havi, kéthavi), mások a visszamenőleges (éves, többéves) tájékoztatást szolgálták az alábbiak szerint: 6.
Az indexek feldolgozás időspektruma, időtényezője szempontjából
Időspektrum Kurrens tájékoztatás Retrospektív keresés /visszamenőleges keresés/
Jelentés egy adott szakterületen megjelenő szakirodalomról való folyamatos tájékoztatás egy valamilyen szempontból lezárt vagy körülhatárolt dokumentumbázisban történő keresés biztosítása
A Tudományos és Műszaki Tájékoztatásban (TMT) c. folyóirat esetében a KWIC– index az évente külön megjelent tartalomjegyzék részét képezi. Ennek fő része a bibliográfia (szerzőnevek, cikkek címe, lapszámok stb.) mely lényegében a havi tartalomjegyzékek kumulált jegyzéke. Ehhez kapcsolódik a névmutató, a KWIC-index („tárgymutató (permutált KWIC-index)‖ néven, valamint a használati útmutató. A TMT 50. évfolyamának megjelenése kapcsán a partnerlapok képviselőinek köszöntései között szó esett a folyóirat innovatív munkája kapcsán arról, hogy annak „egy jellegzetes példája a hatvanas évek végén ilyennek számító KWIC index bevezetése a folyóirat éves tárgymutatója céljára. Az ötlet bevált, hiszen máig ez a permutált index szolgál az éves mutatóban a tárgyi keresésre.‖11 A KWIC indextételek készítéséhez vizsgálatokat végeztünk a szombathelyi Könyvtárés Információtudományi Tanszéken a Tudományos és Műszaki Tájékoztatás 50. születésnapja kapcsán. Az éves indexben megjelent indextételek mintája kapcsán azt elemeztük, hogy az eredeti címek, illetve az indexben megjelenő indextételek hogyan viszonyulnak egymáshoz. A vizsgálat során 2 esetcsoportot különböztettünk meg, s azok alatt további alcsoportokat: − (1) az eredeti cím kellően specifikusan fejezte ki az újdonságot, ily módon megfelelő, változatlanul jelent meg az indextételben. Pl. Európai üzleti és gazdasági információk CD-ROM-on – finn esettanulmány. 11
Kovács Katalin: Boldog születésnapot, TMT! A könyvtáros szaklapok köszöntői = Tudományos és Műszaki Tájékoztatás 50. évf. (2003) 9-10. sz. URL:
http://tmt.omikk.bme.hu/show_news.html?id=3366&issue_id=444
35
INFORMÁCIÓKERESŐ NYELVEK II. −
(2) Az eredeti cím nem felelt meg teljes mértékben indextételként, és ezért – (a) ki kellett egészíteni tematikus vagy/és formai, földrajzi, idő-kulcsszavakkal, (b) – a címben szereplő rövidítést fel kellett oldani, – (c) a cím specifikus volt ugyan, de pontosítást, pl. formai kiegészítést igényelt, (d) a cím túl általános volt, az alcímet is fel kellett használni, – (e) a cím figyelemfelkeltő volt, de nagyon hiányos, a specifikus tartalom hiányzott. E legutóbbi – 2e) esetet két példával illusztráljuk, megadva az eredeti címet, illetve azt, hogy végül is mi jelent meg a KWIC-indextételben: − Cím: Egy sajátos bibliamagyarázat. − Indextétel. Az elméleti informatika problémái, a Biblia sajátos értelmezése. − Cím: Létezett-e Mihajlov? − Indextétel: Találgatások Mihajlov professzorral, a szovjet információs szakemberrel kapcsolatban. Dialog szolgáltatási rendszer SET KWIC alkalmazás A Dialog szolgáltatási rendszerben a KWIC index formátumot használó adatbázisszolgáltatások esetére létezik a SET KWIC parancs. Ennek az a jelentősége, hogy segítségével 2–50 szó között beállítható egy kiválasztott szóhoz kapcsoló szövegkörnyezet megjelenítése. A mellékelt példában láthatjuk, hogy a keresőkérdés kiválasztásánál a VAGY parancsot alkalmaztuk, melynek eredményeképpen a VIDEOPHONE szót egybeírva, illetve a kettő közötti szóközzel egyaránt kiválasztottuk. A példában a beállítás szerint 14 szó szerepelhet a szövegkörnyezetben. A lap alján az első körben megjelent 3 találatban láthatjuk a kiválasztott szót szövegkörnyezetében. Ld. mellékelt példa.12
8. kép 12
A SET KWIC alkalmazás a Dialog szolgáltatási rendszerben
Support : Dialog Search Aids: Successful Search Aids: Successful Searching: SET: Set KWIC. URL:
http://support.dialog.com/searchaids/success/set_kwic.shtml
INFORMÁCIÓKERESŐ NYELVEK II. Az interneten tanácsokat adnak KWIC indexlisták készítésére. Ilyen pl. a Cardbox, általános célú adatbázis kínálata.13 Szövegkonkordancia alkalmazások A konkordancia fogalma és alkalmazásai Konkordanciának nevezzük egy könyv vagy egyéb írásmű (legfontosabb) szavainak ábécébe szedett jegyzékét, melyhez statisztikai, gyakorisági vizsgálat és szövegkörnyezetes elemzés társulhat.14 A számítógépes korszak előtt csak az igazán fontos szavak (például nevek, tárgyszavak, évszámok stb.) szerint, illetve csak fontos művek (például a Biblia) vagy személyek (például Shakespeare) munkáit vetették alá ilyen vizsgálatnak. Napjainkban a konkordancia-vizsgálat fontos része a nyelvészeti vizsgálatoknak is. A szövegben előforduló szavak sorrendezhetők gyakoriságuk és betűrendjük szerint, illetve KWIC, vagy KWOC index segítségével egy-egy szó közvetlen környezeti előfordulásai is megjeleníthetők. Igen hasznos lehet nyelvtanulásban, stilisztikai vizsgálatokhoz, definíciók esetleges hiányának, vagy hiányosságainak kimutatásához. Edict. Com Concordance Ez az angol nyelvű konkordancia-vizsgáló eszköz több témakörben is használható, egy megfelelő szót kiválasztva, és kerestetve, pl. „business‖, de lehetőség van a krimiszeretők számára arra, hogy vagy az Agatha Christie stories, vagy a Sherlock Holmes stories modulban keresgéljenek. A mellékelt oldalon láthatjuk a „business‖ szóra találatként megjelent indextételek egy részét a szövegkörnyezetükbe ágyazva.15
13
Cardbox [általános célú adatbázis] www.cardbox.com/v2/kwic.htm Konkordancia [Wikipédia szócikk]. URL: http://hu.wikipedia.org/wiki/Konkordancia 15 Web Concordancer (English). URL: http://www.edict.com.hk/concordance/WWWConcappE.htm; 14
http://www.edict.com.hk/scripts/cgi-bin/Wwwconcgram.exe
37
INFORMÁCIÓKERESŐ NYELVEK II.
9. kép
Az Edict.com Concordance példája KWIC index alkalmazása
A kijelzés alapján ki lehet választani és részletesebben megnézni a scripteket: MTA Nyelvtudományi Intézet korpusz alkalmazás A KWIC index fontos szerepet kap a Magyar Tudományos Akadémia Nyelvtudományi Intézete által gondozott korpuszban is. A mellékelt példa az álom szóra való keresésre adott inextételek egy részét mutatja a korpuszban. A találatok előtt a nyelvváltozat, alkorpusz, lekérdezés, lekérdezett korpusz mérete, találatok száma, keresés idő szerinti adatok közlése után jelennek meg a KWIC indextétel sorok.16
16
VÁRADI Tamás: The Hungarian National Corpus. In: Proceedings of the 3rd LREC Conference, Las Palmas, Spanyolország, 2002. 385-389. p. URL: http://corpus.nytud.hu/mnsz; http://corpus.nytud.hu/cgibin/hnctest/hnc_hun.cgi
INFORMÁCIÓKERESŐ NYELVEK II.
10. kép
KWIC indextételes megjelenítés a magyar nyelvi korpuszból
3.3.5.KWOC index A kulcsszavas indexek elterjedt típusa a KWOC index is. A KWOC feloldása: KeyWord-Out of Context, azaz Kulcsszó a szövegkörnyezetből kiemelve. Lényege, hogy a kulcsszavat a szövegkörnyezetből kiemelve jól áttekinthetően tesszük kereshetővé, majd a következő sorban a kulcsmondat környezetében is megjelenik. Később kezdték használni, mint a KWIC indexet. Megjelenését az indokolta, hogy a KWIC indexsor sorhosszúsága korlátozott, ami azzal járhat, hogy az indextétel nem fér el teljes terjedelemben egy sorban, fontos kulcsszavak kimaradnak, sőt sorban a címnek se az eleje, se a vége nem található meg. Ez a KWOC indexnél nem fordulhat elő. A KWOC indextétel formája A KWOC-indexben a kulcsszó és a szövegkörnyezet elválik egymástól, a kulcsszavat szövegkörnyezetből kiemelve jelenítik meg. A KWIC-indexnél hozott indextétel az alábbiak szerint jelenik meg a KWOC-indexben:
39
INFORMÁCIÓKERESŐ NYELVEK II.
11. kép
Példa KWOC indextétel megjelenítésére
A KWOC-index fő előnye, hogy jól áttekinthető, fő hátránya, hogy idő- hely-, és költségigényes. Nem véletlen, hogy a KWIC-index az, amely szélesebb körben elterjedt! A KWOC-indexelés lépései 1. lépés: A „nyers cím‖ /=a dokumentum eredeti címe/ és a dokumentum elemzése, 2. lépés: a cím kiegészítése, módosítása, vagy új indextétel létrehozása, 3. lépés: a számítógépes rendezés. − 1-2. lépés: A kulcsszavak megválasztása gyakorlatilag ugyanúgy történik, mint a KWIC esetében. − 3. lépés: A számítógép – az általa nyilvántartott stoplista alapján – kiemeli a címből a jelentősnek tekintett kulcsszavakat. Majd azok alatt a betűrendben a teljes címet /indextételt reprodukálja. A KWOC index esetében a szövegkörnyezet a teljes, nem kerül sor automatikusan megcsonkításra. A cím mellett megtalálható lehet a dokumentum szerzője, esetenként más adat is. Az index alkalmazása A felhasználó szempontjából jó tudni, hogy az ún. KWOC-index lényegében egy olyan komplex index, mely három részből áll: szerzői index, melyben a szerzők neve szerint lehet keresni, tárgyi/tematikai index, (ez a KWOC-index), melyben a feltárt dokumentumokra vonatkozó kulcsszavas indextételek szerint lehet keresni, melyekhez a dokumentumok kódja kapcsolódik, s végül a bibliográfiai rész, melyben az egyes dokumentumok bibliográfiai leírásai találhatók. A KWOC index értékelése A KWOC index fő előnye, hogy jól áttekinthető. Fő hátránya, hogy idő- és helyigényes, ezekből következően költségesebb, mint a KWIC. Nem véletlen, hogy a KWIC index az, amely szélesebb körben elterjedt! A KWOC index – a KWIC indexhez hasonlóan egy komplex kiadvány részeként jelenik meg, melynek fő része a bibliográfiai rész az egyes dokumentumok bibliográfiai leírásaival. Ehhez kapcsolódik a szerzői index, melyben a szerzők betűrendje szerint lehet keresni, illetve a- tárgyi/tematikai index (KWIC vagy KWOC index), melyben a feltárt dokumentumokra vonatkozó kulcsszavas indextételek szerint lehet keresni, és a dokumentum ismertetéséhez a kódja segítségével eljutni.
INFORMÁCIÓKERESŐ NYELVEK II. 3.3.6
Automatikus indexek, internetes keresők
A kulcsszavak szerinti keresés az 1990-es évektől óriási népszerűségnek örvend az internetes keresőrendszereknek köszönhetően. Ezek használata hozzánőtt mindennapjainkhoz, a Google, a blogkeresők, képkeresők, hírkeresők megszokott keresési eszközök lettek. Az internetes keresőrendszerek (más neveken internetes keresők, internet keresők, internetes keresőszolgáltatások) tömeges tájékozódási igényeket elégítenek ki. − Kezdetben ambiciózusán a teljes web feltárására vállalkoztak. Az eredeti cél nem teljesült, de az igyekezet a minél szélesebb spektrum lefedésére továbbra is megmaradt. − Az általános keresők (pl. Google, Yahoo stb.) a weben általuk elérhető dokumentumok teljességében keresnek, a speciális keresők egy-egy szegmenset fednek le, pl. tematikus keresők, képkeresők, blogkeresők, hírkeresők. − Az elérhető web módszeres és rendszeres végigjárására vállalkoznak, törekedve a teljességre, hogy a feltett keresőkérdésekre minél teljesebb bázison adjanak találatokat, illetve a pontosságra, hogy ezek a találatok minél jobban megfeleljenek a felhasználó számára. − A felhasználó a keresés során kulcsszavakat fogalmaz meg, melyeket beírva elindítja a keresést, hogy néhány másodpercen belül megkapja a találati listát. Az egyszerű keresésen túl elvileg fejlettebb keresőeszközöket is igénybe vehet (pl. „pontos kifejezés‖ megadása, Boole-algebrai műveletek, időszakra, nyelvre, földrajzi helyre korlátozás stb.). Ezekre a specifikus keresési lehetőségekre külön is felhívja a figyelmet az internet kereső, de, - a felmérések szerint – kevesen veszik igénybe. − Az indexelő adatbázisban sor kerül a keresett szavak sokoldalú elemzésére: a relevanciaellenőrzés során figyelembe vett szempontok: milyen gyakran fordul elő a szövegben, előfordul-e együttesen a címben, címfejben és a szövegben is. − További fontos elemzési kritériumok: csatolóként ugrópontként kijelölték-e a szót a szövegen belül, az adott weblapra milyen számban mutatnak linkek más weblapokról, a weblap szövegének nyelvi elemzése, a beírt keresőszó előfordulási gyakorisága az adott indexelő-szolgáltatás teljes adatbázisában stb.) A relevanciaelemzés alapján kerül a találatok rangsorolására. − A rendszer megjeleníti a felhasználó számára a megadott szavakra illeszkedő dokumentumok találati listáját, rangsorban, rövid címeikkel és rövid, pár soros kivonataikkal (a leginkább illeszkedő részekkel). − A rövid leírás alapján relevánsnak tűnő dokumentumokat a webcímek, linkek segítségével megjelenítjük a képernyőn, majd elkezdjük a tanulmányozását. A fő problémák: a tartalom ellenőrizetlen, a pontosság viszonylag alacsony fokú – sok esetben kezelhetetlenül sok találatot kapunk és nagy a zaj, az összefüggések nem megfelelően kezeltek – nem képesek kellően láttatni a jelentésbeli (szemantikai) összefüggéseket. Megj.: az internet keresők keresőgépek áttekintéséhez jó szolgáltatott nyújtanak a startlapok pl. a keresőgépek.lap.hu, a kereső.lap.hu, illetve a mélyweb.lap.hu . (Ld. bővebben Információkereső nyelvek 3. félév, 9. lecke)
41
INFORMÁCIÓKERESŐ NYELVEK II. 3.4
ÖSSZEFOGLALÁS
A lecke 1. részében az indexelés, és index szerteágazó fogalmába nyer betekintést. Ezt követően az indexek különféle szempontok szerinti tipizálása következik. A 2. részben az indexeket a kereshető ismérvek szempontjából csoportosítjuk, majd a 3. részben két tipizálási szempontot (automatizáltság mértéke, szabályozottság mértéke) kombinálva, a kulcsszóindexek, illetve a tárgyi indexek alapvető ismérveit mutatjuk be, példák alkalmazásával. A 4. részben részletesen megismerkedik a széleskörű alkalmazásnak örvendő KWICindex (szövegkörnyezetes kulcsszó-index) fogalmával, újdonságaival (szövegkörnyezet mutatása, permutáció), készítésének módszertanával, előnyeivel, hátrányaival, a ciklikus permutáció technikájával. Az 5. részben a KWIC index különféle alkalmazásait ismerjük meg példák segítségével. Mivel viszonylag gyorsan, kis költséggel és munkaigénnyel készíthető, napjainkban is számos szolgáltatásban alkalmazzák (nyelvészeti korpuszokban, konkordanciajegyzékekben, adatbázisokban (pl. a Dialog szolgáltatási rendszerben). A 6. részben megismerjük a KWIC-indexsszel rokon, szintén félautomatikus KWOCindex fogalmát, példán keresztül a készítési módját, előnyeit, (pl. jobb áttekinthetőség), hátrányait, (pl. nagyobb költség). Végül tudatosítottuk, hogy az óriási információmennyiségek feldolgozásának korában a szövegszavak, kulcsszavak szerinti indexelés és keresés tömeges szolgáltatásként az internetes keresőrendszerekkel valósítható meg. A 7. részben áttekintettük az internetes indexelőrendszerek (internetes keresők) fő ismérveit, Kapcsolódó tantárgyak: Bibliográfiai adatfeldolgozás, Számítógépes hálózatok, Internetes keresőrendszerek. 3.5
ÖNELLENŐRZŐ KÉRDÉSEK
1.
Értelmezze az index fogalmát és típusait!
2.
Mik az index fogalmának fő ismérvei?
3.
Mik a KWIC index sajátos ismérvei?
4.
Fejtse ki a KWIC index készítésének lépéseit!
5.
Tömören vegye számba a KWIC index fő alkalmazásait!
6.
Fejtse ki részletesebben a könyvtári információs alkalmazásokat!
7.
Fejtse ki, mi a lényege a szövegkonkordancia alkalmazásoknak!
8.
Fejtse ki a KWOC index lényegi ismérveit, a KWIC indexszel összevetve!
9.
Mennyiben különbözik az internetes indexelő rendszerek működése a fenti kulcsszavas indexekétől?
10. Ismertesse a relevancia értékelés fő szempontjait az internetes keresőrendsze-
reknél!
INFORMÁCIÓKERESŐ NYELVEK II.
4. INDEXELÉS: A PRECIS ÉS A HIVATKOZÁSI INDEX 4.1
CÉLKITŰZÉS
A lecke tanulmányozása után legyen képes − annak kifejtésére, hogy a PRECIS milyen szerepet játszik az indexelés elméletében és gyakorlatában − a relációmegőrző transzformáció fogalmának kifejtésére, − a PRECIS index sajátos szintaktikai megközelítésének kifejtésére, − az elv alkalmazására a gyakorlatban − A PRECIS index fő összetevőinek bemutatására − a PRECIS index magyarországi műhelyének bemutatására − A hivatkozás index sajátos keresési szempontjainak kifejtésére, − A hivatkozási index különböző célú alkalmazásainak értelmezésére
4.2
TARTALOM
1. A PRECIS index alapjai 2. A PRECIS szintaktikai szabályrendszere, indexelési szabályai A PRECIS szintaktikai szabályrendszere − Az indexelés folyamata − Az indextétel elemeinek rotációja − Az indexelés eszközei 3. A PRECIS összehasonlítása más indexekkel 4. A PRECIS alkalmazása, használatának elterjedése − Az index alkalmazási tapasztalatai − Az index használata az OPKM rendszerében − Mi őrződött meg a PRECIS-ből? 5. A Hivatkozási index alapjai − A hivatkozási index ismérvei − A hivatkozási index kiadásai, elektronikus változata 6. A hivatkozási indexben való keresés − Az egyszerű/könnyű keresés − A teljes körű keresés 7. A hivatkozási index alkalmazási céljai, példái − Alkalmazási célok − Impakt faktor jelentősége − A hivatkozási indexbe való bekerülés, problémák − Könyvtár- és információtudományi alkalmazási példák 8. A hivatkozási indexek fejlesztési irányai 43
INFORMÁCIÓKERESŐ NYELVEK II.
4.3
A TANANYAG KIFEJTÉSE
4.3.1 A PRECIS index alapjai Az index fejlődéstörténete, fő ismérvei A PRECIS betűszó a Preserved Context Indexing System rövidítése, amely „szövegöszszefüggést megtartó indexelési rendszer‖-t jelent. Az angol Derek Austin dolgozta ki: Lényegében grammatikai szabályok összessége, és az indextétel felépítése a természetes nyelvű mondat szerkezetére hasonlít. A PRECIS kidolgozása egy sajátos probléma megoldásával függ össze. 1971-ben, amikor azt a döntést hozták Angliában, hogy a Brit Nemzeti Bibliográfiát (British National Bibliography) közvetlenül MARC adatok alapján számítógéppel állítják elő, a programot egyből el is kellett halasztani. Kiderült ugyanis, hogy a stratégia minden mezőre kidolgozott, kivéve a tárgyi feldolgozáséra!. Derek Austin-t kérték fel, hogy dolgozza ki a tárgyi feldolgozás elveit, stratégiáját, szabályrendszerét. Austin azonnal felismerte, hogy a számítógépesítés nagyobb rugalmasságot biztosíthat, s arra törekedett, hogy „megkönnyítse az indexelők életét‖, hogy a kötöttségektől megszabadulva az indexkifejezésekben és azok kapcsolataiban gondolkodhassanak. A PRECIS szerinti elemzés során rövid tárgyi kijelentéseket kell megfogalmazni a dokumentumokról. Ezeket nyelvi-logikai elemzésnek vetik alá, sorra megvizsgálva, hogy mi a kijelentés (a „mondat‖) állítmánya, tárgya, alanya, „időhatározója‖, „helyhatározója‖ stb. Az alapvető fogalmakat kijelölésük után a program a rekordokban „megforgatja‖ (to allow shuffling), mely során azok vezető, módosító, vagy kiegészítő pozícióba kerülhetnek. Az egyes kielemzett „mondatrészek‖ jelentik az összetevőket, amelyeket a gép kidolgozott szabályrendszer alapján kódok, operátorok stb. révén kezel és rendez. A kidolgozott rendszert bevezették, a gyakorlati tapasztalatok alapján folyamatosan fejlesztették és számos más nyelvre, így magyarra is átültették. Magyarországon 1986-ban kísérletileg, 1987-ben pedig gyakorlatilag is bevezette az OPIR (Országos Pedagógiai Információs Rendszer), amelynek fejlesztő intézménye az Országos Pedagógiai Könyvtár és Múzeum (OPKM) volt. Horváth Tibor a Könyvtárosok kézikönyve 2. kötetében17 idézi C. Foskettet, aki azzal méltatta a PRECIS-t, hogy annak számos előnyös tulajdonságát más osztályozási rendszerben is fellelhetjük, ám a „PRECIS az egyedüli, amely a felhasználók és indexelők életét megkönnyíti‖. Nézzük meg, hogy sikerült ezt elérnie? 4.3.2 A PRECIS szintaktikai szabályrendszere, indexelési szabályai A PRECIS szintaktikai szabályrendszere A PRECIS alapelveiben a természetes nyelv grammatikáján nyugszik. Chomsky és követői szerint a mondatok ún. mélyszerkezete minden nyelvben közös, azaz nyelvi univerzálé. Nem véletlenül adaptálták különféle nyelvekre. 17
HORVÁTH Tibor, SÜTHEŐ Péter: A tartalmi feltárás. In: Könyvtárosok kézikönyve. 2. köt. Feltárás és visszakeresés. Bp. : Osiris, 2001.
INFORMÁCIÓKERESŐ NYELVEK II. A többi osztályozó/indexelő rendszertől (pl. ETO, a Kongresszusi Könyvtár tárgyszórendszere stb.), a PRECIS-nek nincs saját kidolgozású „szótára‖, nem tartozik hozzá az osztályozási kifejezések eleve meghatározott gyűjteménye. A szótára nyitott: új szavak és kifejezések vonhatók be, úgy, ahogy megjelennek a szakirodalomban. Megj.: az OPKMben időközben kidolgoztak egy tezaurusz szerkezetű pedagógiai tárgyszójegyzéket. A PRECIS ennek az alkalmazási szabályait határozta meg. A PRECIS a természetes nyelv két fontos jellemzőjének érvényesítésére törekszik: (1) a kontextuális kötöttségre, azaz a mondatokban a szavak értelmezik az utána következőket, (2) Az egy-az-egyhez kapcsolat megőrzésére, amely arra utal, hogy a mondatban a szavak sorrendje kötött. Tekintettel arra, hogy a PRECIS a lexikai egységeket szintaktikai előírásokkal is szabályozza, szintaktikai IKNY-nek, röviden szintaktikus nyelvnek is hívhatjuk. A PRECIS célja, hogy az osztályozási elemekből – a szövegszavakból, tárgyszavakból, deszkriptorokból – a természetes nyelvi mondatokhoz hasonló relációmegőrző indextételeket hozzon létre. Az OPKM-ben történő alkalmazásban (Varga Katalin közlése) az indextételek megalkotását egy igen mély szövegelemzés előzte meg. Az elemzés eredménye egy fókuszmondat volt, amely egy nagyon tömör referátumhoz hasonlóan képes visszaadni a szöveg lényegét, a mondat elemei pedig az alkalmazott információkereső nyelv elemei. Az indextétel készítőjének egyszerre kellett alkalmaznia a tárgyszavazáshoz és a referátumkészítéshez szükséges készségeket. A PRECIS esetében meghatározott műveletek rendjéről van szó. A tételek prekoordináltak, és a kialakított mondatban minden egyes kifejezésnek megvan a szemantikai helye. Az indexelés folyamata A PRECIS szerinti indexelés során három lépéssor követi egymást. 7.
Sorszám 1. lépés
2. lépés 3. lépés
A PRECIS indexelés folyamata
A lépés célja A kvantálást követően a dokumentum információtartalmát, ismérveit a benne levő összefüggéseket megtartva egy mondatban megfogalmazni . A fenti alapján egy ún. bemeneti szóláncot alkotni és adatlapra rögzíteni. A fentiek alapján, meghatározott kódok stb. használatával a számítógép segítségével szerkeszteni és rendezi az indextételeket.
Eredménye Egy természetes nyelvre emlékeztető mondat A bemeneti szólánc egyben a számítógép inputja Szerkesztett, rendezett indextételek
A fenti lépések közül a 2. lépést mutatjuk be részletesebben, mely a PRECIS indexelés legjellemzőbb lépéssora. 45
INFORMÁCIÓKERESŐ NYELVEK II. A bemeneti PRECIS- tételek előállítása Szemantikai-logikai elemzés Az indexelési folyamat egy mondattani elemzést tükröz, melynél a következő alapkérdéseket kell feltenni és tisztázni? 1. Mi a cselekvés? Mi a mondatban kifejezett indextétel „állítmánya‖? 2. Mi a cselekvés tárgya? Kire, mire irányul a cselekvés, ki, mi a folyamatnak, a cselekvésnek a tárgya? 3. Ki, vagy mi hajtja végre a cselekvést – Ki az „ágens‖? A három fenti kérdésre adott választ (mondatbeli szerepet) ún. operátorokkal kell jelölni a PRECIS-ben: − A cselekvés, történés, folyamat előtt a (2) operátor áll majd, − A cselekvés tárgya előtt az (1) operátor, − A cselekvés végrehajtója előtt pedig a (3) operátor. Nézzünk egy bevezető példát a bemeneti szólánc megalkotására! − A dokumentum címe: Az informatika tanulása DVD-vel − Mi a cselekvés, mi történik? – Tanulás. − Mi a cselekvés tárgya? Mit tanulnak? – Informatikát − Mi a cselekvés végrehajtója, ágense? Mivel tanulnak, minek a segítségével? – DVD-vel. Ezek a természetes nyelvű mondatok legfontosabb összetevői is. (1) informatika (2) tanulás (3) CD-ROM Az indextétel elemeinek rotációja A vezető, módosító és kiegészítő pozíció Az indextételek formátuma meghatározott, és az abban szereplő kontextuálisan kötött kifejezések – egy meghatározott rotációs szabály szerint – három pozícióba kerülnek: vezető, módosító, kiegészítő. A PRECIS-indextételek a szóláncok kiemelt kifejezései, a „vezetők‖ betűrendjében találhatók meg. Minden tétel annyiszor szerepel – a megfelelő helyen – ahány vezetőt az osztályozó szakember a bemeneti szóláncban kijelölt. A tárgyszavak a „vezető‖ pozíción kívül még további kettőbe kerülhetnek /módosító, illetve kiegészítő pozícióba/. A három pozíció szerepe és egymáshoz való viszonya: − 1, vezető pozíció (lead), – meghatározza besorolást és elérést, − 2, módosító pozíció (qualifier), – módosítja a vezető pozícióban levő tárgyszó jelentését, − 3, kiegészítő pozíció (display), – kiegészíti és árnyalja az előző kettő által elindított mondatot. A három pozíció viszonyának grafikus ábrázolását ld. sematikusan a mellékelt ábrán:
INFORMÁCIÓKERESŐ NYELVEK II.
12. kép
A vezető, módosító és kiegészítő pozíció a PRECIS indexben
Kérdés, hogy a fentiek alapján hogyan alakulnak ki egy PRECIS indextételből a PRECIS-mondatok vagy bemeneti tételek, a Vezető (besorolási/elérési) pozíció – a Módosító pozíció, illetve a Kiegészítés? Az indextételen belüli rotáció A feldolgozandó szöveg tárgya legyen a Wechsler által (1939) kifejezetten a felnőtteknek készült WAIS (verbális és performációs skála) intelligenciamérő skála. A szöveg reprezentálásához elegendőnek tartjuk az „intelligencia mérése Wechslerskálával‖ szövegösszefüggés reprezentálását. Ebből a PRECIS segítségével megállapított indextétel − intelligencia − mérés − Wechsler-skála A fentiek alapján az indextételben generálható „szóláncok‖ ld. a mellékelt 13. ábrán:
13. kép
PRECIS index példa az indextételen belüli rotációra
Az indexelés eszközei Milyen szabályrendszer és eszközök állnak rendelkezésre a PRECIS szerinti indexeléshez? – elsődleges és másodlagos kódok, elsődleges és másodlagos operátorok. Mi az operátorok, kódok és jelek funkciója és hogyan alkalmazzuk azokat? 47
INFORMÁCIÓKERESŐ NYELVEK II. Az operátorok szerepe és csoportjai Az operátorok alapvetően fontos szerepe az, hogy az utánuk álló tárgyszavak funkcióját, szerepét jelölik az osztályozási kifejezéssorban. A mondatbeli viszonyokat fejezik ki – s így segítségükkel megvalósítható a lexikai egységek összefüggésbeli viszonyainak, sorrendiségének szabályozása. Két nagy csoportjuk van: Az elsődleges operátorok – a szavak szintaktikai szerepét határozzák meg és számokkal jelöljük őket, pl. (0) (2) (4) (6) A másodlagos operátorok – szemantikai-logikai szerepeket jelölnek, és betűkkel jelöljük őket. Példa az elsődleges és másodlagos operátorok használatára Beszámoló jelentés a hazai tájékoztatási intézmények szolgáltatásainak fejlesztéséről szervezési szempontból − (0) Magyarország − Tájékoztatási intézmények − (p) szolgáltatások − (2) fejlesztés − (4) szervezési szempont − (6 jelentés) A kódok és jelek szerepe A kódok – formai, tipológiai, nyelvi szabályozó funkciókat látnak el, különféle technikai fogásokra adnak lehetőségeket, pl. ragok (végződések) beillesztésére, több téma szétválasztására stb. A tipográfiai jelek az elrendezést, tipográfiai szerkesztést vezérlik. Az itt röviden ismertetett operátorok, kódok és jelek technikájának igénybevételével a PRECIS indextételek egy-egy természetes nyelvi mondathoz lettek hasonlók. HORVÁTH Tibor és ORBÁN Éva tanulmányában – további példák találhatók az operátorok, kódok, tipográfiai jelek használatáról.18 A rendszerről részletes információk érhetők el UNGVÁRY Rudolf és ORBÁN Éva kommentált szöveggyűjteményében is. 19 4.3.3 A PRECIS összehasonlítása más indexekkel Az alábbiakban példán keresztül vizsgáljuk meg ugyanazon dokumentum feltárásának eredménye, indextétele hogyan szerepel három különböző indexben, a PRECIS mellett a permutált tárgyi indexben, illetve a KWIC-indexben. Mindhárom indextípus esetében az input előkészítése emberi feldolgozással történik, a PRECIS esetében indexelési módszernek megfelelő szerepoperátorok és kódok alkalmazá18
HORVÁTH Tibor, ORBÁN Éva: PRECIS = Tudományos és Műszaki Tájékoztatás. URL:
http://tmt.omikk.bme.hu/show_news.html?id=3072&issue_id=371 19
Derek Austin és a PRECIS. In: Ungváry Rudolf, Orbán Éva: Osztályozás és információkeresés. Kommentált szöveggyűjtemény. Bp.: Országos Széchenyi Könyvtár, 2001. 1. köt. – Az osztályozás elmélete. 288-327. p. URL: http://mek.oszk.hu/01600/01683/pdf/01683-1.pdf
INFORMÁCIÓKERESŐ NYELVEK II. sával. Induljunk ki abból, hogy a dokumentum tárgyát mindhárom esetben ugyanúgy határozták meg. Ezt követően a tételeket a program alapján a számítógép állítja elő, az adott indextípusra jellemző, meghatározott szintaktikai szabályok követésével. A PRECIS-index esetében pl. az input során megadott vezető, módosító, kiegészítő pozíciókat figyelembe véve. Hasonlítsuk össze, hogy a három indextípus (PRECIS-index, permutált tárgyi index, illetve a KWIC-index) a fentiek alapján milyen indextételeket, elérési pontokat generál. (1) PRECIS index szerinti megjelenítések: INTELLIGENCIA mérése Wechsler-skálával MÉRÉS Intelligencia, Wechsler skálával WECHSLER-SKÁLA Intelligencia mérése (2) Permutált tárgyi indexben való megjelenítések: INTELLIGENCIA. Mérés. Wechsler skála. MÉRÉS. Wechsler skála. Intelligencia. WECHSLER SKÁLA. Intelligencia. Mérés. (3) KWIC indexben való megjelenítések: Az intelligencia mérése Wechsler skálával + mérése Wechsler skálával + Az intelligencia Wechsler skálával + Az intelligencia mérése Az összehasonlítás az alábbi tanulsággal jár: − Mind a három index esetében előnyös, hogy a tartalom egyes aspektusait jellemző keresőszavak az alkalmazott eljárásoknak köszönhetően mindig szövegkörnyezetben jelennek meg. − Ugyanakkor a PRECIS index esetében a szöveg üzenete, mondanivalója az átgondolt elemzési módszerrel a természetes nyelvi mondatokhoz hasonló szerkezetben, relációmegőrző indextételekben jelenik meg. − A permutált tárgyi index, és a KWIC-index – bár ugyanazokat az elemeket használja, a permutáció mechanikus jellege miatt ezt a mondatszerű, relációmegőrző logikát nem tudja olyan meggyőzően demonstrálni. − Ugyanakkor a kulcsszóindex, ill. permutált tárgyi index készítése lényegesen egyszerűbb és olcsóbb, nem igényel alapos elemzést, nem igényli operátorok, kódok alkalmazását.
49
INFORMÁCIÓKERESŐ NYELVEK II. 4.3.4 A PRECIS alkalmazása, használatának elterjedése Az index alkalmazási tapasztalatai A PRECIS előnye a többi indextípussal szemben az, hogy a tartalmat teljes terjedelmében reprezentáló releváns kifejezések találhatók a tételben (nem pl. a cím), és a természetes nyelvhez közelít a tétel szerkezete (nem csak mechanikus permutáció, mint a fenti összehasonlító példákban!). Szerepoperátorai és rotációs technikája segítségével a tárgyszavak közti szövegösszefüggést megőrizve a természetes nyelv mondataihoz hasonlóan informál a tartalomról. A PRECIS-t – kis módosításokkal – több nyelvben bevezették. Elsősorban indexkészítésre, illetve a folyamatos tájékoztatás egyik eszközeként használták, de szerepet kapott a nyelv szórendjét lehetővé tevő szerkezetei, mondatai révén a tárolási és visszakeresési funkciók fejlesztésében is. A PRECIS index alkalmazásával kapcsolatban jók voltak a tapasztalatok. Az amerikai felhasználásáról G. Donald Cook megállapította, hogy az átlagos PRECIS-indexlánc, kódjai nélkül is, kb. 25%-kal hosszabb, mint egy átlagos LCSH-tétel (természetesen ugyanarra a rekordra vonatkozva.) A PRECIS-indextételben nem mindenegyes szó számít hasznos elérési pontnak, de kimutatták, hogy a permutáció révén a PRECIS-elérési pontok száma háromszorosa annak, amit az LCSH produkál. (WYNAR, B.S.20) Mindezen jó tapasztalatok ellenére, a PRECIS alkalmazása az 1990-es években fokozatosan beszűkült. A Brit Nemzeti Bibliográfiában helyét a Kongresszusi Könyvtár tárgyszórendszere (LCSH, Library of Congress Subject Headings) vette át. Időközben az automatizált osztályozásban és indexelésben olyan hatékony megoldásokat dolgoztak ki a szövegelemzésre, szövegkezelésre, melyek a létrehozók szerint nem tették szükségessé a PRECIS további alkalmazását. Az index használata az OPKM rendszerében Magyarországon az Országos Pedagógiai Könyvtár és Múzeum (OPKM) keretében még évekig használták a pedagógiai szakirodalom feltárására. A PRECIS alapján történt a Magyar Pedagógiai Irodalom (kurrens nemzeti szakbibliográfia, 1989-), valamint a Külföldi Pedagógiai Információ c. kurrens bibliográfia mutatójának készítése. Alkalmazták a Pedagógiai Adatbázisban (PAD), mely 1989-től tartalmazta a Magyar Pedagógiai Irodalom c. nemzeti szakbibliográfia teljes anyagát, valamint az OPKM-ben feldolgozott idegen nyelvű szakkönyvek és válogatott folyóiratcikkek adatait. A PAD-ban az 1990-es évek végén kettéválasztották (1) a visszakeresés szempontjait szolgáló mellérendelő tárgyszavazást és (2) a tartalmi feltárás válogatást segítő eszközeként alkalmazott PRECIS indexelést. Az OPKM OPAC-jában a kettő jól megfért egymással. A felhasználó a mellérendelt tárgyszavak között keresett, a megjelenítési formátumban azonban e tárgyszavak szövegösszefüggést tükröző láncaival találkozott, amelyek, (Varga Katalin szavaival) mintegy annotációként informálták a dokumentum tartalmáról. Az alább mellékelt szurrogátumban szereplő tárgyszavas indextétel ehhez a megközelítéshez kapcsolódik. Ugyancsak tanulságos, hogy a dokumentum szöveges ismertetése is 20
WYNAR, B.S. Introduction to Cataloguing and Classification. 8th ed. Littleton, CO: Libraries Unlimited, Inc., 1992. 463.p.
INFORMÁCIÓKERESŐ NYELVEK II. mennyire segíti az eredeti szövegösszefüggések ábrázolását, a természetes nyelv lehetőségeivel.
14. kép
A tárgyszavak helye az OPKM indextételében
Mi őrződött meg a PRECIS-ből Miért fontos a PRECIS ismerete? – Azért, mert a benne kidolgozott elvek és módszerek jelentős hozzájárulást jelentettek a szintaktikai indexelés fejlődésében, az általa bevezetett eredmények az indexelés általános síkján ma is mérvadóak. A PRECIS utóéletéről Varga Katalin az alábbiakat írta 2005-ben: Az OPKM több mint egy évtizeden át (1989–2000) alkalmazta a PRECIS indexelési eljárást a szövegösszefüggés megőrző indexelésre. Egy évtized tapasztalatai arra vezettek, hogy a szakirodalom jelenleg még nem feltétlenül igényli azt a mélységű feltárást, amit a PRECIS nyújt, de valamiféle szintaxisra mindenképpen szükség van az információkeresés pontossága érdekében. Ezért a PRECIS-ből megőrződött az operátorok sorrendjéből származó szintaxis, valamint az a gondolkodásmód, amelyet a PRECIS indexelést gyakorló könyvtárosok rutinszinten elsajátítottak, nagyon jót tesz az indextételeknek. Az elv tulajdonképpen annyi, hogy a tárgyszavak sorrendje közelítsen a tartalmat összefoglaló természetes nyelvű mondat sorrendjéhez.21 A mellékelt ábra az elektronikus tanulási környezet rekordjáról ezt tanúsítja.
21
Varga Katalin: A magyar szakirodalom tartalmi reprezentációjának jelenlegi állapota = Tudományos és Műszaki Tájékoztatás, 52. évf. 2005. 7-8. sz. URL: http://tmt.omikk.bme.hu/show_news.html?id=4008&issue_id=464
51
INFORMÁCIÓKERESŐ NYELVEK II.
15. kép
Az elektronikus tanulási környezettel foglalkozó rekord az OPKM WebOPAC-jában
4.3.5 A Hivatkozási index alapjai A hivatkozási index ismérvei Ha ismerem egy szerző vagy több szerző nevét, aki az engem érdeklő témáról írt, és meg tudom nézni, hogy rá kik hivatkoztak, valószínű, hogy a hivatkozó szerzők dokumentumai is érdekesek számomra. Ily módon fel tudom göngyölíteni egy témakör fejlődésének alakulását. Az 1960-as évek felszabadult légkörű „ihletettségében‖ dolgozta ki Eugene Garfield a Hivatkozási index fenti ötletét, melyet a Science Citation Indexben természettudományi hivatkozási index valósított meg 1964-ben, azóta jelenik meg az ISI (Institute for Scientific Information) gondozásában, az amerikai Philadelphiában. A hivatkozási index – az az indextípus, mely a publikációk közötti hivatkozásokat tartalmazza, lehetővé téve a felhasználók számára, hogy megállapítsák, mely későbben megjelent dokumentumok mely korábban megjelent dokumentumokra hivatkoznak. A hivatkozási indexben tehát a szerzők és az általuk írt dokumentumok képezik a keresés alapját. Alapjában különbözik ily módon azoktól a kulcsszavas, illetve az ellenőrzött szótárakkal működő tárgyi indexektől, melyek a dokumentumok tartalmi jellemzésére azok szövegét használják fel.
INFORMÁCIÓKERESŐ NYELVEK II. Napjainkban az általános célú tudományos hivatkozási indexeknek két olyan kiadója van, amelyet a könyvtárak előfizetés ellenében igénybe vehetnek. − az ISI (jelenleg a Thomson Scientific része), melynek indexei a weben a Web of Science név alatt érthetők, a Web of Knowledge adatbázis csoport részeként, − az Elsevier, mely a Scopus-t adja ki online módon hasonlóan. A továbbiakban az ISI által kiadott hivatkozási indexeket mutatjuk be részletesebben: A hivatkozási index kiadásai, elektronikus használata A számítógéppel készült hivatkozási indexek eleinte nyomtatott formában is elérhetők voltak, vaskos, negyedévente kiadott kötetekben, éves kumulációkkal. Ma már a retrospektív keresést nyújtó elektronikus adatbázisok használata dominál. A Hivatkozási index elérése a Web of Science (WoS) adatbázis segítségével történik, mely a Web of Knowledge adatbázis gyűjtemény része. Az interneten elérhető adatbázisok szolgáltatásait a magyar felsőoktatási intézményekben oktatók és hallgatók regisztráció alapján, ingyenesen igénybe vehetik 2001 óta az Elektronikus Információ Szolgáltatás program 22(rövidítve EISZ) keretében23. A WoS-t az ISI (Institute for Scientific Information,a Thomson Scientific része) gondozza. Három adatbáziscsomagja három tudománycsoportot fog a teljes körű keresés keretében: Természettudományok: Science Citation Index Expanded (SCI-EXPANDED) – 1900tól Társadalomtudományok: Social Sciences Citation Index (SSCI) – 1900Művészetek és bölcsésztudományok: Arts and Humanities Citation Index /A and HCI/ – 1900A méretek érzékeltetetésére: a (Science Citation Index Expanded), 150 tudományterületről, több mint 6500 kiemelkedően fontos folyóiratban megjelent publikációt dolgoz fel. A három index esetében együttesen 10 000 a világ legnagyobb impaktfaktorral rendelkező folyóiratának az anyagát dolgozza fel. Emellett nyílt hozzáférésű folyóirataik is rendelkezésre állnak, illetve több mint 110 000 konferencia-kiadvány! 4.3.6 A hivatkozási indexben való keresés A keresés alternatívái a hivatkozási indexben A Web of Science adatbázisaiban kétféle módon kereshetünk: (1) egyszerű/könnyű kereséssel (Easy Search), mely egy leegyszerűsített változat, vagy (2) teljes kereséssel (Full Search), mely teljes körű keresést tesz lehetővé az adatbázisban.
22
TÉGLÁSI Ágnes: Elektronikus Információ Szolgáltatás (EISZ) nemzeti program. In: Könyvtár és társadalom vonzásában. Köszöntőkönyv dr. Tóth Gyula 70. születésnapjára. Szerk CZÖVEK Zoltán, KOLTAY Tibor, PÁLVÖLGYI Mihály. Szombathely, 2008. Savaria University Press. URL: http://www.bdf.hu/btk/trsi/kvtar/Kutats%20tudomnyos%20mhelyek/Tanszéki%20kiadványok/Tanulmányok %20a%20Könyvtár%20és%20Információtudományi%20Tanszék%20műhelyéből/1_Konyvtar_es_tarsadalom_vonzasaban.pdf 23 Elektronikus Információ Szolgáltatási program. URL: http://www.om.hu/eisz
53
INFORMÁCIÓKERESŐ NYELVEK II. Az egyszerű/könnyű keresés Az EISZ szolgáltatás keretében egyetemi-főiskolai hallgatók, oktatók, kutatók is használhatják a hivatkozási adatbázisokat. A benne való keresés fortélyait meg lehet ismerni angolul a Web of Science honlapján vagy az ISI Citation Database Help oldalain levő útmutatók alapján. 24 Milyen keresési lehetőségek adódnak? Miután kiválasztottuk első lépésben a számunkra érdekes egy vagy több adatbázist, megválaszthatjuk a megfelelő keresés típusát: Téma szerinti keresés (topic). Egy vagy több kifejezés írható be, ami lehetőség szerint a legpontosabban utal a keresett tanulmányok témájára, pl. Public relations, Library science stb. Ehhez igénybe vehetők a Boole-operátorok (pl. AND vagy OR), a csonkolás stb. Személynévre keresés (Person) Három módon történik: (1) Author, – a szerző által írt cikkek listája, (2) Cited author – hivatkozott szerző, azon cikkek listája, amelyekben hivatkoznak egy adott szerzőre (3) Subject – az illető személyről szóló tanulmányok listája. Hely szerinti keresés (Place) - Meghatározott intézménnyel, és/vagy földrajzi hellyel összefüggésbe hozható szerzők cikkeinek keresését szolgálja. Beírhatók: földrajzi helyek, pl. ország, állam, tartomány rövidítése vagy irányítószáma, egy város neve (pl. Budapest), vagy egy intézmény/testületnév rövidítve (pl. Berzsenyi Coll). A teljes körű keresés A Full Search (teljes keresés) számos kiválasztási és kombinációs lehetőséget nyújt a három adatbázis valamelyikének kiválasztása után: Science Citation Index Expanded (SCI-EXPANDED) Social Sciences Citation Index (SSCI) Arts and Humanities Citation Index (A and HCI) A három adatbázis ebben a keretben 1900-ig visszamenőlegesen kereshető. Adott esetben fontos lehet, hogy leszűkítsük a tételek keresését, rövidebb, általunk kívánt időintervallumokra. Ily módon választhatunk a kurrens, illetve retrospektívtájékozódás között. Ld. a mellékelt ábrán:
16. kép
24
A keresés leszűkíthető a legfrissebb tételekre:
ISI Citation Database Help. URL: http://wos.isitrial.com/help/helpquik.html
INFORMÁCIÓKERESŐ NYELVEK II. Ezeken túl bármely évre, vagy meghatározott évekre is leszűkíthető a keresés A teljes keresésnek kétféle kiindulópontja lehet: az általános keresés, illetve a hivatkozott szerzők szerinti keresés. − Általános keresés General Search (általános keresés) – témakör, szerző neve, folyóirat címe, vagy a szerző címe szerint − Cited ref search (hivatkozott szerzők szerinti keresés) – azoknak a cikkeknek a keresése, amelyek egy adott szerzőre, vagy műre hivatkoznak Az általános keresés Az általános keresés (general search) használata esetén írja be azokat a keresőszavakat vagy kifejezéseket, amelyekre kíváncsi, használhatja az AND vagy OR operátort is. A keresőkérdést leszűkítheti nyelvre (language), dokumentumtípusra (document type), de kijelölheti a találati lista rendezési módját is (sort option). Kereshet témakör, szerző, a forrás címe, a szerzők intézményneveinek címe szerint. A témakör szerinti keresés (TOPIC) – a cikkből, pl. annak címéből, vagy referátumából vett szavak, vagy kulcsszavak szerinti keresést biztosít. A szerző szerinti keresés (AUTHOR) – egy vagy több szerző szerinti keresést tesz lehetővé, pl. O'BRIAN C* OR OBRIAN C* A forrás címe (SOURCE TITLE) a folyóirat címe szerint kereshet, melyet egy forráslistáról másolhat ki és illeszthet be, pl. az ACTA BIOLOGICA HUNGARICA Szerzők intézményneveinek címe (ADDRESS) – a szerző/k/ intézményneveinek rövidített változatai szerint kereshet, pl. YALE UNIV SAME HOSP, de szintén kereshető a városnév, az országnév szerint, pl. HUNGARY A keresés tovább szűkíthető a legördülő menüsorokból a megfelelő opciókat kiválasztva: 8.
A dokumentum eredeti nyelve /language/ – A dokumentum típusa /document type/ A találati lista rendezése /sort results by /
A keresés szűkítési lehetőségei a Hivatkozási indexben
pl. angol, bengáli, magyar, német stb. pl. cikk, referátum, kiállított műtárgy, bibliográfia stb. a legfrissebb dátum szerint, a hivatkozások száma szerint, relevancia, az első szerző, a forrás címe szerint
Nyelvi index – segítségével megválasztható a publikáció eredeti nyelve. Így pl. képet nyerhetünk arról, hogy valamely témakörben hány eredetileg francia, német, magyar stb. cikket vettek be az indexbe. Elemző-eszköz (analyze tool) –Lehetőséget ad arra, hogy a rejtett trendeket, fejlődési mintákat megtaláljuk, felfedezzük a feltörekvő kutatási területeket, azonosítsuk a vezető kutatókat, intézményeket és folyóiratokat. Citation Report (hivatkozási jelentés) rendszeres képet ad egy-egy év hivatkozási tevékenységéről.
55
INFORMÁCIÓKERESŐ NYELVEK II. Citation maps (hivatkozási térképek) – lehetővé teszik, hogy a hivatkozások közötti kapcsolatokat vizuálisan áttekinthessük és felfedezzük egy-egy cikk hivatkozási kapcsolatait. 4.3.7
A hivatkozási index alkalmazási céljai, példái Alkalmazási célok
A hivatkozási index számos fontos célra vehető igénybe. (1)Irodalomkutatási segédeszköz − A felhasználók számára jól alkalmazható irodalomkutatási feladatok megoldásához, hiszen az irodalomkutatás szinte tetszőlegesen kiterjeszthető – egy jól megválasztott kiinduló (hivatkozott) kiadványhoz megtalált és relevánsnak bizonyuló tanulmányok további hivatkozásai is sorban áttekinthetők. − Az irodalomkutatást jelentősen megkönnyíti, hogy nincs terminológiai probléma, mivel az indexelés bibliográfiai eszközökkel történik − Számos szemletanulmány található a hivatkozási indexben. (2) A tudományos fejlesztési irányok, témák követésének, elemzésének eszköze − A hivatkozások követése és tanulmányozása segíti az egyes tudományterületek, szakterületek kutatási-fejlesztési irányainak követését, egy-egy kutatási téma fejlődésének nyomon követését. − Segít választ találni olyan kérdésekre, hogy egy adott felfedezéssel, elmélettel, hipotézissel, anyaggal mi történt azóta, hogy pl. az első róla szóló kiadvány megjelent. − Nyomon követhetők a tudomány – régebben és újabban publikált – eredményei közötti kapcsolatok, látható, hogyan építkezik egy-egy tudományterület, azon belül egy-egy speciális témakör, hogyan alakulnak, fejlődnek az elméletek. − Kellő elemzési készség alapján jó alapanyagként használható az egyes tudományok szerkezetére és dinamikájára vonatkozó, statisztikai jellegű vizsgálódásokhoz is. Interdiszciplináris, multidiszciplináris kutatás eszköze − Mivel nem kötődik egy-egy szűk tudományterülethez, az interdiszciplináris kutatásokban különösen jól használható, az egyes területek összefüggései kimutathatók, jól áttekinthetők Megadott időintervallumokban való rugalmas keresés eszköze − Az index segítségével a számunkra releváns dokumentumok ismeretében eljuthatunk újabb, későbbi megjelenésű, frissebb dokumentumokhoz. Leszűkíthetjük az időintervallumot /csak a legutóbbi hétre, hónapra, évre stb./ aszerint, hogy melyikre vagyunk kíváncsiak. A terminológiai problémák csökkentésének eszköze − Segítségével csökkennek a terminológiai problémák. A dokumentumokat ugyanis nem az indexelők által kijelölt /esetleg „szubjektív‖, vagy „mesterséges‖ tárgyszavak, deszkriptorok alatt lehet keresni, hanem az „élő‖, a szerzők által megírt, s általunk ismert témáról szóló dokumentumok alapján.
INFORMÁCIÓKERESŐ NYELVEK II. Nyelvek szerinti elemzés eszköze − Bár a hivatkozási indexekben az angol nyelvű irodalom kétségkívül dominál, de eredeti nyelvként szinte minden egyes nyelv képviselve van, a magyar is. Tudományos teljesítmény mérési segédeszköz − Tudományos minősítési mércének számít, hogy valaki bekerül-e a hivatkozási indexbe, és milyen mértékben szerepel abban. − Méri és feltérképezi a hivatkozott mű és hivatkozó közötti tartalmi kapcsolatot. − A tudományos teljesítmény mérése, a rangsorolás, a minősítés egyik fontos eszköze. Impakt faktor jelentősége Az impakt faktor (leggyakoribb magyar fordításban hatástényező) a tudományos folyóiratok átlagos idézettsége alapján létrehozott mutatószám. A folyóiratok impakt faktora (magyarul néha hatástényezőnek is nevezik) annak a mértéke, hogy milyen gyakran idézik a tárgyévben a folyóiratnak a megelőző két évben megjelent „átlagos cikkét‖. Az impakt faktor segít megítélni a folyóiratok relatív fontosságát, különösen az ugyanazon szakterületen működő többi folyóirat között. Az impakt faktort úgy számítjuk ki, hogy a folyóirat előző két évben publikált cikkeire a tárgyévben kapott idézetek számát elosztjuk a folyóiratban az előző két évben publikált cikkek számával.25 Az ISI évente adja ki jelentését (Journal Citation Reports, JCR), mely mindenegyes vizsgált folyóirat esetében meghatározza annak impact tényezőjét (impact factor). A tudományos közösségben az egyes folyóiratok impact faktora alapvetően fontos tényezőnek, számít, ugyanakkor a megállapítását ellentmondásosnak találják. Az ISI adja ki a legtöbbet hivatkozott kutatók listáját (Highly Cited Researchers), amelyet tényezőként figyelembe a világ egyetemei tudományos rangsorának (Academic Ranking of World Universities) meghatározásában (kiadója a Shanghai Jiao Tong University).26 A hivatkozási indexbe való bekerülés feltételei, problémák A hivatkozási indexbe való bekerüléshez szigorú szelekciós követelményeknek kell megfelelni, csak megfelelő tudományos folyóiratokban megjelent cikkek juthatnak be. A folyóiratokra megadott cikkszám csak az eredeti közleményeket és összefoglaló („review‖) cikkeket tartalmazza. A szerkesztői vezércikkek („editorials‖), levelek („letters‖), híranyagok („news items‖) és előadáskivonatok („meeting abstracts‖) eleve nem számítanak a cikkek számába. Problémát jelent a gyűjtésbe bevont folyóiratok körének meghatározása. Sok fontos folyóirat kimarad, főleg amelyik kis országban, kis nyelven jelenik meg, bár ott mérvadó szerepet tölt be. 25
Impakt faktor. Összeáll: Schubert András. URL: http://www.kfki.hu/library/imp/JCR_Magyar.htm – http://www.kfki.hu/library/imp/impakt_faktor.htm 26 Institute for Scientific Information [wikipedia szócikk] http://en.wikipedia.org/wiki/Institute_for_Scientific_Information
57
INFORMÁCIÓKERESŐ NYELVEK II. A nem angol nyelven és kiváltképp a nem latin betűs írással publikáló folyóiratok kevésbé hozzáférhetőek a világ kutatóközössége számára, és ez befolyásolhatja az idézettségüket. A bibliográfiai hivatkozások olykor bizonytalanok, különböző nem objektív, esetleg presztízs-okokra is visszavezethetők, vannak olyanok a szakmában, akikre illik hivatkozni. A fenti problémák mindegyike megjelenik a szakirodalomban, különféle kritikák, reflexiók formájában. Mindezek alapján, Schubert András idézett anyaga szerint, nem tanácsos a folyóiratok értékelése során kizárólag a JCR adataira támaszkodni. Az idézettségi adatok nem hivatottak helyettesíteni a szakértői véleményt. Gondos figyelmet kell fordítani arra a számos tényezőre, amelyek az idézettséget befolyásolják: a nyelvre, a formai és történeti tényezőkre, a megjelenési gyakoriságra, valamint a szakterületre. Könyvtár- és információtudományi alkalmazási példák Mint minden tudományban, a könyvtár- és információtudományban is vannak meghatározó, mérvadó személyiségek. Ilyenek az utóbbi 20 év vonatkozásában pl. Maurice B. Line, Peter Ingwersen, Dagobert Soergel, Tefko Saracevic, a sor természetesen folytatható. Mindegyikük a tudományterület valamely ágában irányadó, szintetizáló szerepet játszanak. Tefko Saracevic pl. az információtudomány átfogó területén túl a digitális könyvtárak fejlesztése, a felsőfokú és tudományos képzés terén. Nyilvánvaló, hogy tudásukat nagyszámú saját publikációban osztják meg másokkal, jelen vannak a hivatkozási indexben, nagyon sokan hivatkoznak rájuk. Ismervén nevüket és a kiemelt szakterületüket, feltételezhető, hogy mind az általuk hivatkozott tételek, mind pedig a rájuk vonatkozó hivatkozások tanulságosak számunkra. Három példát hozunk 1. A mellékletben Tefko Saracevicnek a digitális könyvtárak értékelése terén mérvadó tanulmányára (Library Trends, 2000) vonatkozóan mutatunk be egy hivatkozást. G.G. Chowdhury Saracevicre hivatkozó 2002-ben megjelent cikke Saracevic mellett további 67 hivatkozást tartalmaz, ami ezért is értékes!
17. kép
Hivatkozási példa a hivatkozási indexből
A következő táblázat Peter Ingwersen 210-szer hivatkozott tanulmányán keresztül mutatja be a hivatkozás-követő adatok típusait.27 1996. évi megjelenése óta 210-en hivatkoztak a szerző Journal of Documentation-ban megjelent tanulmányára. 27
SARACEVIC, Tefko – GARFIELD, Eugene: On measuring the publication productivity and citation impact of a scholar: A case study. In: Ingwersen Festschrift. 187. p. URL:
INFORMÁCIÓKERESŐ NYELVEK II. 9.
Adattípusok Title [cím] Source [forrás] Author(s) [szerző(k)] Times Cited [hivatkozások száma]: Search for ARTICLE [a cikk keresése]
A hivatkozás-kimutató információk szerkezete
Konkrét adatok Cognitive perspectives of information retrieaval interaction. Elements of a cognitive IR theory. JOURNAL OF DOCUMENTATION Volume52 Issue 1 Pages 3-50 Published MAR 1996. Ingwersen, P. 210
Egy harmadik példa. Aida Slavic, az ETO konzorcium egyik vezető munkatársának 2008-ban, a Journal of Documentation-ban megjelent tanulmánya egy nemzetközi, 208 országban végzett felmérésében eredményeit elemzi és összegzi arról, milyen mértékben használják az ETO-t világszerte. A tanulmánya 42 hivatkozást tartalmaz. A 2004–2006-os szakirodalmi adatok alapján, az ETO-t 124-ben használták (60%), ebből 34 vizsgált országban az ETO a nemzeti információs hálózatokban a fő osztályozási rendszer (28%). 45 országban (36%), csak bizonyos típusú könyvtárakban használták, 45ben (36%) csak szűkebb körben, néhány könyvtárban, vagy információs központban használták.28 A tanulmányra megjelenése 2008. évi megjelenését követően eddig – 2010. június 12 – ketten hivatkoztak. 4.3.8 A hivatkozási indexek fejlesztési irányai A hivatkozások indexelésében fordulatot jelent(het) az automatikus hivatkozás indexelő rendszerek megjelenése, elsőnek 1998-98-ban a CiteSeer (újabban CiteSeerX, a Cora (újabban Rexa), mely elsősorban a számítógép-, és információtudományra összpontosít. Ezeket követte a Google Scholar és a Microsoft Academic. Ezek az autonóm hivatkozási indexek még nem tökéletesek teljesen, a hivatkozások automatikus kivonatolásában és klaszterezésében, kb. 10%-os hibaaránnyal dolgoznak. (az angol nyelvű Wikipedia Citation index szócikke szerint). Schubert András a hivatkozási index minél jobb alkalmazását segíti azzal, hogy az alapfogalmakat (pl. impakt faktor jelentését), a magyar vonatkozásokat, illetve az egyes szakterületek vezető folyóiratait bemutatja gazdag összeállításában.29
http://comminfo.rutgers.edu/~tefko/Saracevic%20Garfield%20-%20Ingwersen%20Festschrift%202010.pdf SLAVIC, Aida: Use of the Universal Decimal Classification: A world-wide survey = Journal of Documentation. Vol. 64. Issue 2. 2008. p. 211–228. 29 SCHUBERT András: Impakt faktor. Összeáll. --. URL: http://www.kfki.hu/library/imp/impakt_faktor.htm 28
59
INFORMÁCIÓKERESŐ NYELVEK II.
4.4
ÖSSZEFOGLALÁS
A 4. leckében két indextípust ismert meg, melyek sajátos szerepet játszanak az indexek között, ami a megközelítésükből és módszereikből fakad. Először a PRECIS indexszel ismerkedik meg, melynek lényege, hogy a természetes nyelvi mondatra emlékeztető indextételek generálását teszi lehetővé, nyelvtudományi alapokra építve. A Brit Nemzeti Könyvtárban használták először, és magyarországi bevezetésére is sor került az Országos Pedagógiai Könyvtár és Múzeumban. Példák alkalmazásával megismerte a PRECIS szintaktikai szabályrendszert, az indexelés folyamatát, az indextételen belüli rotációs eljárást, és az indexelés eszközeit. Majd az index hatékonyságát hasonlíthatta össze egy példa alapján két permutált indexével. Bár már nem használják, megőrződött az indextétel mondatszerű összeállításának módszere, célrendszere, alkalmazási továbbra is hat a feltárási gyakorlatra. A lecke második részében a hivatkozási index fogalmát, működését, a benne való keresés módszereit, valamint az index sokrétű alkalmazásait ismerte meg (a tudományos minősítés, rangsorolás eszköze, irodalomkutatási, tudományos trendkövetési segédeszköz). Áttekintést nyert az alkalmazását kísérő problémákról, melyek elsősorban az angol nyelv dominanciájával kapcsolatosak. Végül a hivatkozás indexelés legújabb fejlesztési eredményeibe (automatikus hivatkozás-indexelés) is betekintett.
4.5
ÖNELLENŐRZŐ KÉRDÉSEK
1.
Értelmezze a PRECIS index fogalmát!
2.
Fejtse ki, miben látja a PRECIS index jelentőségét!
3.
Mi az operátorok szerepe a PRECIS indexelésben?
4.
Milyen eredmények kapcsolódnak a PRECIS index magyarországi alkalmazásához?
5.
Hogyan értékelhető a PRECIS index a permutált tárgyi indexszel összehasonlítva?
6.
Fejtse ki, mi az újszerű a hivatkozási index használatában!
7.
Fejtse ki az impakt faktor jelentését és jelentőségét!
8.
Értékelje a keresés módszereit, lehetőségeit a Hivatkozási indexben!
9.
Milyen új lehetőségeket tárnak fel az automatizált hivatkozási indexek?
10. Melyik indextípust találta a legérdekesebbnek és miért?
INFORMÁCIÓKERESŐ NYELVEK II.
5. A TÁRGYSZAVAZÁS ALAPJAI 1. 5.1
CÉLKITŰZÉS
A lecke feldolgozásával legyen képes − a tárgyszó és a tárgyszórendszer ismérveinek kifejtésére, − a tárgyszavazással összefüggő szabályozás jelentőségének bemutatására, − a tárgyszavak nyelvi és logikai szabványosításával összefüggő kérdések bemutatására, − a tárgyszavak alaktani elemzésére, a tárgyszavak formájával és szerkezetével kapcsolatos tudnivalók kifejtésére, − a tárgyszavak jelentéstani elemzésére, − a tárgyszórendszer szervezési szintjének elemzésére, − a szabályozás elveinek és feltételeinek megfogalmazására
5.2
TARTALOM
1. A tárgyszavak rendszerbe foglalása – A tárgyszó fogalma, lényeges ismérvei – A tárgyszórendszer fogalma – A tárgyszó, tárgyszórendszer és tárgyszavazás összefüggései – A tárgyszavazás hagyományai 2. A tárgyszavas keresőnyelvvel szembeni elvárások 3. Természetes nyelvből szabályozott tárgyszónyelv – Tárgyszónyelv és természetes nyelv összehasonlítása – A szabályozás döntési helyzetei 4. A szabályozás területei – szótan – Összetett szavak, többtagú szerkezetek – Rövidítések kezelése 5- A jelentéstani szabályozás területei – Értelmező és magyarázó szövegek használata – Azonos alakú, különböző jelentésű szavak – a homonimák kezelése – Különböző alakú, azonos jelentésű szavak – a szinonimák kezelése – Tárgyszavak közötti kapcsolatok – a hivatkozások jelölése – Tárgyszavak közötti kapcsolatok jelölése 6. A szabályozás területei – a tárgyszórendszer szervezési szintje 7. A szabályozás elvei és feltételei
61
INFORMÁCIÓKERESŐ NYELVEK II.
5.3
A TANANYAG KIFEJTÉSE
5.3.1 A tárgyszavak rendszerbe foglalása A tárgyszó fogalma, lényeges ismérvei A tárgyszó a természetes nyelv szavait, kifejezéseit, szószerkezeteit használja fel tárgyi feltárásra, indexelésre, de azokat bizonyos mértékű szabályozásnak veti alá. A tárgyszavas indexelés építőelemei a természetes nyelv alapján meghatározott, kiválasztott szavak (kifejezések, szószerkezetek). A tárgyszó fogalmi ismérvei: − (1) tömör, − (2) egyértelmű szó vagy kifejezés, − (3) az osztályozó fogalmakat egymástól függetlenül, mellérendelő osztályozással hozzuk létre, − (4) megfelelő mértékű szabályozásnak vetjük alá, − (5) hogy segítségével képesek legyünk a dokumentumokban, szövegekben rejlő tudás lényegét leírni. A tárgyszavazás az az osztályozási, indexelési művelet (folyamat, tevékenység), mely során a dokumentumokban, szövegekben rejlő tudás lényegét tárgyszavakkal írjuk le. Az (4) ismérvet fontos külön hangsúlyozni, megerősítve és értelmezve az 1 és 2. pontot, ahhoz, hogy tömör és egyértelmű legyen, azaz szabályozottnak kell lennie. A tárgyszórendszer fogalma A tárgyszórendszer fogalmának fő ismérvei: (a) dokumentumok tartalom szerinti besorolására használt, természetes nyelven kifejezett fogalmak (b) tartalmilag szabályozott, szükség szerint változtatható szótára, (c) melyben feltüntetik a legfontosabb fogalmi összefüggéseket a tárgyszavak között „lásd‖, „lásd még‖ stb. típusú jelölések formájában. (d) Hagyományos (eredeti, régi) változatában fő-, mellék- és altárgyszavakat, újabb formában posztkoordinált elven szerkesztett tárgyszavakat tartalmaz A meghatározás forrása az OSZK-tezaurusz/Köztaurusz:30
30
OSZK Tezaurusz / Köztaurusz : Tárgyszójegyzék [tezauruszcikk] URL: http://mek.oszk.hu/cgibin/thes.cgi?desc=t%e1rgysz%f3jegyz%e9k&trunc=0
INFORMÁCIÓKERESŐ NYELVEK II.
18. kép
A Tárgyszójegyzék meghatározása és relációi az OSZKtezauruszban
Mit tartalmaz egy tárgyszórendszer? /1/ A tárgyszavakat, amelyek segítségével a dokumentumok tartalmát feltárjuk. /2/ A tárgyszavakkal azonos értelmű természetes nyelvi szavakat (szinonimákat), vagy majdnem azonos értelműeket (kváziszinonimákat), amelyek helyett a tárgyszavakat kell alkalmazni mind a feldolgozás, mind pedig a keresés során, a fogalom és jelölése közti egyértelmű megfeleltetés érdekében. /3/ A tárgyszavak alkalmazásával kapcsolatos megjegyzéseket, értelmezőket, magyarázatokat, ha ez az egyértelmű és következetes használatához szükséges. /4/ A tárgyszavak és tárgyszavak közti kapcsolatokat a jobb áttekinthetőség, a mélységbeni rugalmasság, a sokszempontú megközelítés biztosítása érdekében. A mellékelt meghatározásban egyben példákat is láthattunk a Lásd még általánosabban (hierarchikus összefüggésre), valamint a Lásd még oksági, és Lásd még egyéb összefüggésre is. A tárgyszó, tárgyszórendszer és tárgyszavazás összefüggései A tárgyszavazás olyan osztályozási, indexelési művelet (folyamat, tevékenység), mely során a dokumentumokban, szövegekben rejlő tudás lényegét tárgyszavakkal írjuk le. A tárgyszavazás eredménye, terméke a tárgyszavas indextétel. Ennek elkészítése érdekében a tárgyszavakat (tárgyszavas indexkifejezéseket) rendszerbe kell szervezni, az azok egymáshoz kapcsolásával, az indextétel felépítésével kapcsolatos szabályokon alapulva. A tárgyszavazás lényeges ismérveiből következik a 3 fő elvárás: (1) A szabályozott tárgyszavas keresőnyelv szavaival írja le a dokumentumok (ismeretegységek) lényeges vonásait! (2) Tegye lehetővé a keresést és a böngészést a szükséges tárolási-keresési rendszer kidolgozásával! (pl. az online katalógus, a bibliográfia, az adatbázis stb. tárgyszavas indexe alapján). (3) Tegye lehetővé a felhasználók számára a keresőképek (keresőkérdések) leírását, a keresés témáinak a leírását is!
63
INFORMÁCIÓKERESŐ NYELVEK II. A tárgyszavazás hagyományai A fenti meghatározások kiforrott szemléletet, megközelítést tükröznek, elméleti és módszertani hagyományokra épülve. A tárgyszavazás fejlődésében hat szakaszt különböztethetünk meg: (1) A középkorban és az újkor kezdetén a tárgyszavazásnak még csak elemei jelentek meg más katalógusokon és más mutatókon belül (pl. szerzői katalógusban a tárgy feltüntetésére, cím, szerző nélküli műveknél). (2) Az elvek kidolgozására, a gyakorlati bevezetésre csak a 17. századtól voltak elszigetelt kezdeményezések. Adrien Baillet (1649-1706) így fogalmazta meg a tárgyszavazás fő ismérveit: (a) a feldolgozásnak a könyv kézhezvételén, elemzésén kell alapulnia, (b) meg kell oldani a szinonimák problémáját, (c) egységesíteni kell a régebbi és újabb írásmódokat, (d) a tárgyszavakon belüli sorrendet ki kell alakítani. (3) a tárgyszókatalógus ismérveinek meghatározásakor Martin Schrettinger (17921851) hangsúlyozta (a) az analitikus jellegét, (b) szabályokat, (c) az egységességet, (d) a szinonimák és utalások használatát, (5 ) a szubjektivitást. Esetében már nem csak elvekről és elméletről volt szó, ő mindezt megvalósította: (szabadidejében) 1819-tól kezdve elkészítette a müncheni udvari könyvtár tárgyszórendszerét.
19. kép
Martin Schrettinger (1792–1851)
(4) A tárgyszókatalógus és a tárgyszavazás modern elméletének kidolgozása, mai értelemben vett legfontosabb hagyománya Amerikában született meg és Cutter nevéhez fűződik, aki a Rules for a dictionary catalogue (Washington, 1876. 1. kiad.) c. művében szabatosan megfogalmazta a tárgyszókatalógus szabályait. Az olvasók szükségleteiből és gondolkodásmódjából indult ki, azzal az igénnyel, hogy a tárgyszókatalógus legbonyolultabb eseteire és problémáira is megoldást találjon. Érvényesítette a legszűkebb fogalom elvét, mely szerint a művet a tárgyszó alá kell besorolni, és nem az osztályba, ahova a tárgy tartozik.
INFORMÁCIÓKERESŐ NYELVEK II.
20. kép
Charles A. Cutter
(5) A tárgyszavazás és a tárgyszókatalógusok tömeges elterjedése az 1880-1890-es években indult meg az Egyesült Államokban, majd Európában. A bevezetés több évtizedes folyamat volt, és sikere több tényező együttes hatásának volt köszönhető: − Annak tudatosítása, hogy a hierarchikus szakkatalógusok (önmagukban) elégtelenek a feltárásra. − A tárgyszavazás alkalmazási szabályainak kidolgozása és megjelentetése 1876-ban (Charles Cutter: Rules for a dictionary catalogue), amelyet 1897-ben átvett a Kongresszusi Könyvtár (Library of Congress). − A Kongresszusi Könyvtár dinamikus tevékenysége: 1901-től a tárgyszavakat nyomtatott cédulaszolgáltatásába is bevezette, a cédulákra ráírta a „heading‖-eket. − A társadalmi feltételek megváltozása, mindenekelőtt a lendületes iparosodás, amelynek egyik következménye volt a dokumentáció kialakulása − A gyors változásokat jobban és könnyebben követő mellérendelő osztályozás előretörése. − A technológiai eljárások fejlődése. − Mindezek eredményeképpen a tárgyszavazás a 20. század első felében már megjelent a katalógusokban, bibliográfiákban, majd referáló folyóiratokban, folyóiratrepertóriumokban. (6) A tárgyszavazás fejlődése az 1960-as évektől újabb lendületet kapott, melynek okai − Az adatbázisok megjelenése, tárgyszórendszerek szabályozott keresőnyelvként való alkalmazása.
65
INFORMÁCIÓKERESŐ NYELVEK II. − − −
−
Jól működő szabályozott tárgyszó-, és tárgyszavazási rendszerek francia, spanyol, német nyelven, és kisebb nyelveken is. A magyar könyvtárakban szélesebb körben az 1960-as években jelent meg, az Új Könyvek állománygyarapítási tanácsadónak köszönhetően, A Kongresszusi Könyvtár tárgyszavainak adaptálása a magyar dokumentumok angol és magyar nyelven történő feldolgozására a Debreceni Egyetem Egyetemi és Nemzeti Könyvtárában. A 2000-es években kiteljesedni látszik az OSZK-tezaurusz/Köztaurusz alkalmazása tárgyszavazási célokra a magyar könyvtárakban.
5.3.2 A tárgyszavas keresőnyelvvel szembeni elvárások Mielőtt a szabályozás konkrét eseteibe kezdenénk, szükséges, hogy jegyzékbe foglaljuk az információkereső nyelvekkel kapcsolatos elvárásokat, melyek a tárgyszórendszerekre is vonatkoznak. 10. A tárgyszórendszerrel, tárgyszavazással szembeni elvárások
Elvárások (1) Egyértelműség biztosítása Sokszempontú megközelítés biztosítása
Elvárások részletesen A tárgyszórendszer minden szavának egy és csakis egy jelentése legyen! Minden fogalomnak csakis egy tárgyszó feleljen meg! A tárgyszórendszer legyen képes egy-egy tudásegységet sokféle, azaz tárgyi-tematikus, személyi, intézményi, földrajzi, idő, formai szempontokból leképezni! (2) Áttekinthetőség A tárgyszórendszer – lehetőség szerint – tükrözze az osztályobiztosítása zandó tudomány, szakterület stb. logikai szerkezetét, rendszerét. Legyen áttekinthető, szavai lehetőség szerint „beszéljenek‖! (3) Mélységbeni A keresés során lehessen – ha korlátozottan is,- de navigálni a rugalmasság biztosí- tárgyszavak közötti összefüggések mentén, azokkal kifejezett tása fölé-, ill. alárendelt fogalmak felé. (4) Értelmi összefüg- A tárgyszórendszer tárgyszavai legyenek képesek a fogalmak és gések kimutatása jelenségek közötti alapvető összefüggések ábrázolására, nem-faj, egész-rész, rokonsági viszony, szinonima – kifejezésére. Egyszeri összefüggé- a tárgyszórendszer legyen képes az egyedi tudásegységek diffesek, egyedi informá- renciált „egyedi‖ tartalmának, szövegösszefüggéseinek tükrözéciók leképezése sére! 5.3.3 Természetes nyelvből szabályozott tárgyszónyelv Tárgyszónyelv és természetes nyelv összehasonlítása Ahhoz, hogy természetes nyelvű szóból tárgyszó legyen, mindenekelőtt nyelvi (formai, alaktani, szótani) szempontokból kell ellenőrzés alá vonni. A tárgyszónyelv szókincsében, alaktanában, mondattanában „emlékeztet‖ a természetes nyelvre, de redukáltabb, kötöttebb, „szabványosítottabb‖.
INFORMÁCIÓKERESŐ NYELVEK II. Ha a szóképzés módját vesszük, elszigetelt példákból akár azonosnak is tekinthetnénk a kettőt (Az Új Könyvek tárgyszójegyzékében a Mohácsi csata, Földrengés, Gazdaságnövekedés, Fogaskerék tárgyszavak külön-külön természetesen csengenek). Ugyanakkor a tárgyszavak egymás mellé helyezve, az indextételben, a keresőnyelvi mondatban egy pattogó, tömör, lényegretörő, lecsonkolt, redukált nyelvi elemeiként jelentkeznek. 11. A természetes nyelv és a tárgyszónyelv szembesítése
Összehasonlítási szempont Szófajok használata
Természetes nyelv Bármelyik szófaj
Egyes szám – többes szám Eset
Bármelyik szituációtól, stílustól függően Bármelyik, alany, tárgy, részes stb. Szóösszetételek, összetett szabadon eldönthető szavak megtartása, vagy lebontása
Tárgyszónyelv csak főnév főnévi alakra kell mindent hozni egyes szám – többes szám használata szabályozott csak alanyeset ellenőrzött, hogy melyek tekinthetők egy keresőnyelvi szónak X)
(x), illetve melyeket kell lebontani elemeire pl. Osztályozástörténet, vagy Osztályozás – Történet. Az összevetés igazolja, hogy a „tárgyszónyelv‖ szabályozott, ellenőrzött, formalizált. A szabályozás döntési helyzetei 12. A szabályozás döntési helyzetei
Szóalak Egytagú kifejezés, egy szó Egytagú kifejezés – Összetett szó Kéttagú kifejezés, szintagma
Példa Index, Kutya, Monitor, Szeretet
Alternatívák, döntési helyzet
Kulcsszóindex, Farkaskutya, A szóösszetétel második eleme is felnőttoktatás, Intelligenciateszt fontos lehet, pl. oktatás, felnőtt
tárgyszavas indexelés, Civilizációs betegségek, Római jog Többtagú kifeje- Tárgyszavas információkereső zések nyelv, AIDS elleni propaganda, Hatóság elleni erőszak stb. Rövidítések IKR, IKNY, IFLA, ENSZ, EKTF
A szerkezet legtöbbször jelzős vagy birtokos. Dönteni kell a természetes nyelvi vagy inverz formáról (1) A tárgyszó tagjainak ciklikus permutálásával előállítható az összes lehetséges sorrend (2) Rövidítések is lehetnek tárgyszavak, vagy utalunk róluk a teljes alakra
A tárgyszavazásnál a fenti esetekben mindig dönteni kell, két (esetleg több) lehetőség közül melyiket válasszuk tárgyszónak, s melyikről (melyekről) utaljunk csak rá. 67
INFORMÁCIÓKERESŐ NYELVEK II. Az összetett szavak, két vagy többtagú kifejezések és a rövidítések tárgyszórendszerben való használatakor következetesen szabályzatba kell foglalni az alternatívákról való döntéseket. 5.3.4 A szótani szabályozás területei Az alábbiakban példákon keresztül mutatjuk be, hogy a kéttagú kifejezéseknél, a többtagú szervezetek, a speciális esetek és a rövidítések esetében milyen döntési lehetőségek vannak, és mi a szabályozás menete. Összetett szavak, többtagú szerkezetek Összetett szavak invertálása (1) Ha a szerkezetet megfordítjuk, „invertáljuk‖ (inverzió) akkor a jelzőt hátravetjük, például a Háztartási gépek felveszi a Gépek, háztartási alakot. Az utalás módja pedig: Háztartási gépek L. Gépek, háztartási. (2) Ha a természetes nyelvű kifejezés mellett döntünk, akkor az invertált (megfordított) alakváltozatról készítünk utalót, mintha szinonimáról volna szó, Kémia, szerves lásd Szerves kémia. Megj.: Míg korábban a tárgyszórendszerekben (pl. Új Könyvek tárgyszórendszer alkalmazásának kezdeti időszakában), gyakorta választották tárgyszóként az invertált szerkezetű formát, addig az újabb fejlesztésűekben általában megtartják a tárgyszavak tagjainak természetes sorrendjét, de az invertált változatról indokolt esetben utalót készítenek. Erre az esetre emlékeztet a „történet‖-re végződő tárgyszavak abban az esetben, ha a szabályozás során úgy döntünk, hogy a tárgyszavakat két elemre bontjuk, pl. Filozófia – Történet. Ebben az esetben Történet alatt utalót kell elhelyezni. Történet ld. az egyes szakterületek megnevezése alatt, pl. Filozófia – Történet. Többtagú szerkezetek kezelése A permutált változatok használata helyett a Könyvtárosok kézikönyve azt javasolja, hogy a tárgyszó maga vegye fel a természetes nyelvi sorrend alakját, a többi permutált változatról L utaló készüljön. Példa: Propaganda, AIDS elleni L. AIDS elleni propaganda Két tárgyszó összekapcsolásával leírható témák kezelése Vannak témák, amelyeket eredetileg két tárgyszó összekapcsolása ír le, de az állandósult. Példák: Vallás és Állam, illetve Állam és Vallás, Vallás és Tudomány, illetve Tudomány és Vallás Állam és Egyház, illetve Egyház és Állam. (forrás: Új Könyvek tárgyszójegyzék) Ilyen többtagú kifejezésnek tekinthetők a kapcsolata szó felhasználásával, prekoordinációval keletkezett tárgyszavak: Példa: Erkölcs és vallás kapcsolata Megismételhető a fenti konkrét eljárás, tehát Vallás és erkölcs kapcsolata. De csak utalás is elegendő lehet (ahogy esetleg más tárgyszórendszerben a fenti példa esetében is):
INFORMÁCIÓKERESŐ NYELVEK II. Vallás és erkölcs kapcsolata L Erkölcs és vallás kapcsolata Speciális esetek kezelése Speciális utaló szerkezetek, egyes összetett szavak esetén Rövidítések kezelése Rövidítések is lehetnek tárgyszavak. Ezzel kapcsolatban három esetet, megoldást különböztethetünk meg: (1) A rövidítés úgy átment a köztudatba, hogy a teljes alakja nem is ismeretes, vagy nagyon szűk, szakmai körben. Példák: AIDS betűszó (Acquired Immune Deficiency Syndrome, magyarul Szerzett immunhiányos syndroma, vagy Szerzett Immun Hiányos Tünetegyüttes – amelyet a HI Vírus okoz. Ilyen pl. maga a HIV (Human Immundeficiency Virus szó rövidítése is. Magyarul: emberi immunhiányt (előidéző) vírus. NATO (ebben a formában szerepel a tárgyszórendszerek többségében). A teljes alak: „North Atlantic Treaty Organization‖ így jelenik meg a Kongresszusi Könyvtár tárgyszórendszerében, vagy az MNB Időszaki Kiadványok Repertóriuma tárgyszórendszerében. (2) A köznyelvben, de a tárgyszórendszerben is a rövidítés használatát részesítik előnyben, tömörsége, könnyű használata miatt, esetleg feloldják a teljes nyelvi alakot is. Példa: UNESCO, melynek teljes feldolgozása: United Nations Educational, Scientific and Cultural Organization. Ritka az olyan tárgyszórendszer, mint a Magyar Nemzeti Bibliográfia Időszaki Kiadványok Repertóriuma (MNB IKR) (amely ma már a HUMANUS rendszer része), amely ezt a teljes alakot részesíti előnyben. (3) A köznyelvben az adott fogalmat egyaránt kifejezik teljes nyelvi alakban vagy rövidítésként. Példák: ENSZ vagy Egyesült Nemzetek Szervezete, vagy angolul: UNO vagy United Nations Organisation. Hogy melyiket választják ilyenkor, és melyikről lesz „csak‖ utalás, az tárgyszórendszerenként eltérő lehet. Eltérő lehet az, hogy a magyar vagy idegen nyelvi változatot választják. Példa: az „ENSZ‖ esetében az MNB IKR tárgyszórendszere az angol nyelvű teljes alakot veszi fel tárgyszóként: United Nations Organization. Az összes többi változatról (a magyar nyelv teljes alakról és rövidítésről – Egyesült Nemzetek Szervezete, ENSZ, illetve az angol nyelvű rövidítésről is „csak‖ utaló készül. 5.3.5 A jelentéstani szabályozás területei Értelmező és magyarázó szövegek használata A természetes nyelvben nem jelent nagy gondot a homonimák (pl. körte) használata, mert a szövegkörnyezetből, összefüggésekből ezek általában egyértelműen kiderülnek. (a kétértelműség, a sokféleképpen értelmezhetőség, félreértés gyakran inkább a kabaré, esetleg tragédia kategóriájába tartozik.) A tárgyszavaknál szükséges lehet az értelmező és magyarázó szövegek használata 69
INFORMÁCIÓKERESŐ NYELVEK II. Az értelmezők két funkciót töltenek be: (1) a homonimák szétválasztását (2) vagy a tárgyszó jelentésének pontosítását, használatának egyértelműsítését. A homonimák problémája és kezelése A természetes nyelv egyik legáltalánosabb jelensége az, hogy egy azonos alakú szóhoz (lexikai egységhez) több jelentés is tartozhat. Ezt tudományos műszóval poliszémiának nevezik (poli - sok, szémia - jelentés). Mindez hozzájárul az egyes nyelvek adott nyelv jellegzetességéhez, sokoldalúságához.31 Ugyanakkor ezek a többjelentésű szavak a kommunikációt gátló tényezővé válhatnak, a keresésre adott „találatoknál‖ katasztrofális „eredményeket‖ produkálhatnak. Ezért tárgyszórendszer fejlesztése során gondoskodni kell a többjelentésű szavak ellenőrzés alatt tartásáról. A „szemantikai kontroll‖ célja az, hogy minden egyes lexikai egységhez (esetünkben tárgyszóhoz) egyetlen jelentést rendeljen. Az azonos alakú, de különböző jelentésű szavak neve a homonimák. Ezek a természetes nyelvben a szövegösszefüggésből egyértelműen kiderülnek. Tárgyszórendszerben viszont értelmezővel kell kiegészíteni őket: Példa a homonimák szétválasztására: KOMLÓ (város) KOMLÓ (növény) (2) A tárgyszó jelentésének pontosítása Gyermek (12 éves korig) Az értelmező magyarázó mondat is lehet: Példa: Iskolai könyvtár (Gyermek- és ifjúsági könyvtárak nem tartoznak hozzá). Az Új Könyvek tárgyszójegyzékben a magyarázatok lehetnek bővebbek is, de rendszerint szűkszavúak, és általános utalókhoz vagy általános hivatkozásokhoz kapcsolódnak. Az OSZK-tezaurusz/Köztaurusz a „labilisabb‖ társadalomtudományi/humán fogalmak esetében tartalmaz magyarázatokat. Az utóbbi években a magyarázatok helyett, mellett a fogalmak pontos meghatározása dominál (pl. az e leckében mellékelt Tárgyszójegyzék tezaurusztétel esetében is). Így lehetővé válik a fogalom egyértelmű, pontos használata mind a feltárás mind pedig a keresés során. A szinonimák problémája és kezelése A szinonimák egy fogalomnak különböző szóalakokkal történő megnevezései. Esetükben a jelentés azonos, a jelölő nyelvi kifejezések különbözők. A természetes nyelvben ez általában nem okoz problémát, mivel a nyelv gazdag és árnyalt, és el is várjuk, hogy valaki árnyaltan fejezze ki magát.
31
TIBERI, Melissa; MAZZOCCHI, Fulvio: La gestione della polisemia nei thesauri. Il caso dei termini filosofici.= Boll. AIB. 47.vol. 2007. 1/2.no. 93-107.p. Ismert. MOHOR Jenő: A poliszémia kezelése a tezauruszokban: a filozófiai szakszókincs esete = Könyvtári Figyelő, 2008.1. sz. URL:
http://w3.oszk.hu/manscr/wwwi32.exe/[in=ref1.in]/?08/039*60390
INFORMÁCIÓKERESŐ NYELVEK II. A tárgyszavas nyelveknél a szinonimákat ki kell küszöbölni: az azonos jelentésű kifejezések egyikét tárgyszó rangra emelni, többit kiiktatni. Használatuk tilos, róluk csak utalás történik a tárgyszóra. Ily módon a fogalom egyértelmű megnevezése biztosított. A felhasználói körtől függően dönthetünk a köznyelvi, vagy a szaknyelvi forma mellett. Pl. design vagy formatervezés, illetve a diabetes mellitus vagy a cukorbetegség. Nincs előírás, de amennyiben lehetséges, előnyben kell részesíteni a magyar szót, az egyszerűbb szót. A közművelődési könyvtárak, átfogó nyilvános könyvtárak általában a széles körben elterjedt magyar nyelvű (népszerű) megnevezéseket választják. A szinonimák kezelése lehetővé teszi, hogy a tárgyszórendszerben a kifejezéskészlet ne duzzadjon kezelhetetlen nagyságúvá. A felduzzadás, a terminológiai kontroll hiánya, pl. a magyar nyelv hihetetlen gazdagsága miatt kaotikus állapotokat idézne elő a feltárásban és keresésben. A rövidítések és teljes megnevezések közötti döntési esetekkel már föntebb foglalkoztunk, így további esetekre térünk át. Példák a szinonimák kezelésére Tematikus tárgyszavak A tematikus tárgyszavak kategóriájában számtalan döntési helyzet adódik: (1) Tudományterületek tudományos vagy köznyelvi nevei között – Példák: Geometria vagy Mértan, Pszichológia vagy Lélektan stb. A szakbibliográfiákban, pl. Magyar Orvosi Bibliográfiában általában a tudományos szakszó részesül előnyben, pl. Diabetes mellitus a Cukorbetegség helyett. (2) Élő szervezetek tudományos és népszerű nevei között, pl. növény- és állatnevek latin és magyar megnevezései között, Nemtoidea vagy Fonálférgek, Lepidoptera vagy Lepkék stb. (3) Anyagok, vegyületek tudományos nevei és szerkezeti képletei, köznyelvi változataik pl. víz vagy H2O. (4) Szervezetek, pártok, intézménynevek stb. idegen és magyar nyelvi változatai közt, pl. Koreai Kommunista Párt vagy Csoszon Rodong Dan között. – A könyvtárak – felhasználóikat szem előtt tartva, a magyar nyelvű változatot részesítik előnyben, ugyanakkor a nemzeti könyvtárak (a nemzetközi adatcserébe való bekapcsolódás követelményei miatt), az eredeti idegen nyelvű megnevezést. Földrajzi tárgyszavak A földrajzi neveknél hasonló a helyzet, rengeteg város, hegy, folyó cserélt gazdát, pl. Kassa vagy Kosice, Cluj Napoca vagy Kolozsvár stb. A nyilvános könyvtárakban használt általános tárgyszórendszerekben a magyar névalakot, a nemzeti bibliográfiai rendszerben adott esetben az idegen nyelvű névalakot. A szinonima kapcsolatok jelölése A szinonimák kezelése utalással és visszautalással történik. A szinonimákról a tárgyszóra történő utaló leggyakrabban használt jelei a magyar nyelvben: „L.‖, „ld:‖, vagy „lásd‖ – Példák: Tengeri L. Kukorica, vagy Földtan L. Geológia stb. A tárgyszórendszerekben egyre általánosabb az összefüggések inverzeinek, a visszautalóknak az ábrázolása. Az L (lásd) utalás inverze lehet pl. a H jel, ami azt jelenti, hogy mi helyett áll, mit helyettesít. 71
INFORMÁCIÓKERESŐ NYELVEK II. Példák utalásra és visszautalásra: Krumpli L. Burgonya, – Burgonya H Krumpli, Földtan L. Geológia, – Geológia H Földtan. A visszautalást jelölhetik más jellel is, pl. az Új Könyvek tárgyszójegyzékében x-szel történik. (Megj.: A tezauruszokban az utalások és visszautalások ábrázolása kötelező. ) A kváziszinonima kapcsolatok jelölése A szinonimák sajátos esetei a kváziszinomák. Alkalmazásuk azt jelenti, hogy szinonimaként kezelünk olyan kifejezéseket, amelyek valójában nem azok: a rendszer azonban úgy tesz, mintha azok volnának. Az Új Könyvek tárgyszójegyzékében pl. Gyógyítás ld. Orvostudomány Egy közeli gyűjtőfogalom tárgyszóként befogadhatja a hozzátartozó egyedeket. Például a Sertés a legkülönfélébb sertésfajtákat jelöli. (ami nincs teljesen összhangban a Cutter által megfogalmazott „specifikus tárgyszó‖ elvével.) Tárgyszavak közötti kapcsolatok – a hivatkozások jelölése Az önálló tárgyszavak közötti logikai kapcsolatok jelölése a szabályzat fontos összetevője. Általában a Lásd még (vagy rövidítve ld. még, vagy LM) jellel kezelik. (Pl. az Új Könyvek tárgyszójegyzék alapján). Ezek a hivatkozások. Ismérvük, hogy az önálló tárgyszavak közötti kapcsolatot anélkül jelölik, hogy a kapcsolat milyenségét közelebbről meghatároznák. Ha nem jelöljük tezaurusz-szerűen a logikai kapcsolatokat, a hivatkozás megjelenhet fölé-alárendelt tárgyszavak között is. Gyakori a lefelé hivatkozás, amikor a nemfogalomtól haladunk a fajfogalom felé. Például: Bibliográfia LM Nemzeti bibliográfia Magyar irodalom LM az egyes szerzők neve alatt A tezauruszban árnyaltabban fejezik ki a kapcsolatokat, mint egy sima tárgyszórendszerben (nem-faj, egész-rész, mellett oksági, okozati stb. összefüggések szerint is.) Ugyanakkor van lehetőség arra, hogy a szabványos betűjeles jelölés helyett felhasználó számára egyértelmű, könnyen értelmezhető jelölést használjanak. Az OSZK-tezaurusz/Köztaurusz keresőrendszer felületén pl. a szabványos relációjeleknek a következő felhasználóbarát jelölések felelnek meg. (ld. táblázat). 13. Tezaurusz-relációk szabványos és felhasználóbarát jelölése
Szabványos jelölés F A T P R E X
= = = = = = =
Felhasználóbarát jelölés Lásd még általánosabban: Lásd még speciálisabban Lásd még átfogóbban: Lásd még részletesebben: Lásd még oksági összefüggésben Lásd még okozati összefüggésben Lásd még egyéb összefüggésben:
Minden LM-hivatkozás arra ösztönöz, hová érdemes továbblépni a keresés során, hol remélhető további információ.
INFORMÁCIÓKERESŐ NYELVEK II. A tárgyszavak által jelölt dolgok, fogalmak összefüggéseinek jelölési módjára (nem-, faj-, rokonsági kapcsolatok) a Kongresszusi Könyvtár tárgyszórendszere, (ld. 7. lecke), illetve az Új Könyvek tárgyszójegyzéke (8. lecke), illetve a Köztaurusz esetében (11. lecke) részletesen is kitérünk. A szervezési szint szabályozása A tárgyszórendszerben a tárgyszavak rendje függ a fogalomszervezési szinttől. A kérdés megértéshez az uniterm és unikoncept fogalma szolgál alapul. (3/2 lecke). Az uniterm a legkisebb egyedi egység. Egyes rendszerekben a „Történet‖ tárgyszó önálló elemi használatával és kombinálásával az egyes tudományterületekkel az uniterm elvre emlékeztet, pl. Filozófia – Történet. Más rendszerekben ezeket a fogalmakat „uniconcept‖ (egyedi fogalom) szinten fogalmazzák meg: „Filozófiatörténet‖. Dönteni kell a két megoldás között. Hasonló esetekben, hasonlóan kell dönteni, pl. Művészet – Történet, vagy Művészettörténet. (Megj.: Az Új Könyvek tárgyszójegyzék ebben az esetben az elemekre bontó, unitermes megoldást választotta.) 5.3.6 A tárgyszavak elrendezése A tárgyszavak rendezésére két alaptípus, és egy átmenet létezik: A mechanikus (klasszikus, tiszta) tárgyszórendszerben (jegyzékben) a tárgyszavak rendje mechanikus betűrendes. Az alárendelő tárgyszókatalógusban a tárgyszavak elrendezése fogalmi szintek kiépítésével történik: - Művészetek -- Képzőművészet --- Festészet ---- Tájképfestészet A mechanikus betűrendes, illetve az alárendelő tárgyszórendszer köztes kategóriája a vegyes rendszer. Ennek neve bokrosító tárgyszókatalógus. Ebben a rendszerben a tárgyszavak túlnyomó többsége egységes mechanikus betűrendben sorakozik. Ugyanakkor az átfogó tárgyszavak egy részét közvetlenül utána alárendelt fogalmakra bontják fel. Például: -Kémia -Kémia, analitika -Kémia, fizikai, -Kémia, orvosi, -Kémia, szerves -kémia, szervetlen stb. (Forrás: Új Könyvek tárgyszójegyzék) 5.3.7 Szabályozás elvei és feltételei A tárgyszó nyelvhez kötött keresőnyelv. A nyelvi analógia alapján alaktani, szótani, jelentéstani, mondattani szabályozásokat kell végrehajtanunk. Nyelvenként eltérő a feladat nagysága és jellege is (eltérőek a sajátosságai pl. az angol és a magyar nyelvnek mind alaktani, szótani, jelentéstani, mind pedig mondattani szempontból) 73
INFORMÁCIÓKERESŐ NYELVEK II. A tárgyszórendszer és tárgyszavazás szabályozásánál az alábbiakat kell elsősorban szem előtt tartani: − Az elvárt funkciók – pontosan meg kell határozni, hogy milyen feladatok teljesítéséhez várunk segítséget a tárgyszavazástól, s milyen követelményeket támasztunk vele szemben − A felhasználó elvárásai – a felhasználók szóhasználati jellemzőit ismerni kell, erre építeni a tárgyszavak megfogalmazása, kiválasztása során. − A tárgyszavak tematikai köre – a tárgyszavak tematikai körét meg kell határozni, a tematikai kört „hiánytalanul‖ le kell fedni. − .A szellemi és technikai eszközök a tárgyszavazás alkamazásához szükséges szellemi és technikai segédeszközöket meg kell teremteni, és fejleszteni, a szabályozás feltételeit biztosítani. − A folyamatos fejlesztés követelménye- a fejlesztési kereteket meg kell határozni, tárgyszavazásban, és a szabályozásban együtt kell működni, a tárgyszórendszert és szabályait naprakészen kell tartani.
5.4
ÖSSZEFOGLALÁS
A tárgyszavazási modul az 5–8. leckét fogja át. Ebből az első kettő (5–6 lecke) a szabályozott tárgyszó-nyelv létrehozásához, fejlesztéséhez, alkalmazásához szükséges elméleti, módszertani felkészítést szolgálja. A kezdő leckében először meghatároztuk a tárgyszó, tárgyszórendszer, tárgyszavazás fogalmát, fő ismérveit, majd felidéztük a tárgyszavazás elméleti, módszertani hagyományait. Ezt követően megismerte a természetes nyelv, illetve a tárgyszónyelv közötti lényegi különbségeket, majd a tárgyszavak rendszerbe szervezésének, szabályozásának elveit, módszereit. Betekintést nyert a tárgyszómegválasztás, tárgyszószabályozás alaktani, szótani, szintaktikai, jelentéstani kérdéseibe, feladataiba. Részletesen megismerte a tárgyszó, és nemtárgyszó (szinonimák) kezelésének kérdéseit, az értelmező és magyarázó szövegek használatát, a tárgyszókapcsolatok egyszerűbb és differenciált, tezauruszra emlékeztető jelölési módjait. Áttekintette a tárgyszórendszer szervezési szintjével kapcsolatos alternatívákat. Végül a szabályozási elvek megismerésével tudatosította, hogy a szabályozás elvégzése és érvényesítése a tárgyszavas információkereső nyelv alkalmazásának alapfeltétele.
5.5
ÖNELLENŐRZŐ KÉRDÉSEK
1.
Fejtse ki a tárgyszó és a tárgyszórendszer fő ismérveit!
2.
Vegye számba a tárgyszavazás legfontosabb hagyományait!
3.
Fejtse ki a tárgyszavas kereső nyelvvel szembeni elvárásokat!
4.
Vegye számba a prekoordinált és posztkoordinált tárgyszavas indexelés előnyeit és hátrányait!
5.
Fejtse ki a természetes nyelv és tárgyszónyelv közötti fő különbségeket!
6.
Vegye számba a szabályozás fő teendőit a szavak, a szótan szintjén!
7.
Fejtse ki, mért szükséges a jelentéstani – szemantikai szabályozás!
INFORMÁCIÓKERESŐ NYELVEK II. 8.
Vegye számba a tárgyszavak közötti kapcsolatok típusait és jelöléseit!
9.
Fejtse ki a tárgyszavak elrendezésének lehetőségeit!
10. Adjon áttekintést a szabályozás fő elveiről és feltételeiről!
75
INFORMÁCIÓKERESŐ NYELVEK II.
6. A TÁRGYSZAVAZÁS ALAPJAI 2. 6.1
CÉLKITŰZÉS
A lecke feldolgozásával legyen képes − Az egyes tárgyszókategóriák kifejtésére, − a tárgyszókategóriák és a tartalmi feltárási adatmezők összefüggésének kifejtésére, − az indexelési elvek és követelmények bemutatására, − a különféle alkalmazások felvázolására, − a fejlesztési teendők felvázolására.
6.2
TARTALOM
1.A tárgyszórendszerrel szembeni követelmények 2. A tárgyszókategóriák – A tárgyszókategóriák áttekintése – A tárgyszókategóriák és a tartalmi feltárás adatmezői – A tárgyszókategóriák sajátos jellemzői – Besorolási adatmezők a bibliográfiai rekordban 3. A tárgyszavazás indexelés és szabályozása – Az indexkifejezések és indextételek – Az indexelés alapelvei és példái – Az indextétel elemeinek rendje – Az indexkifejezések kereshetőségének biztosítása – Az indexelés lépései és szintjei Ranganathan szerint 4. Tárgyszavak előzetes vagy utólagos egymáshoz rendelése – A tárgyszavak előzetes egymáshoz rendelése – A tárgyszavak utólagos egymáshoz rendelése – A tárgyszavak permutálása 5. A fejlesztés öt alapkérdése
6.3
A TANANYAG KIFEJTÉSE
6.3.1 A tárgyszórendszerrel szemben követelmények Abból kell kiindulni, hogy egy tárgyszó sose önmagában áll, hanem mindig egy átfogóbb rendszer része. Ezt az átfogóbb rendszert többféle szinten lehet érzékeltetni: (1) egyszerű tárgyszólista – csak felsorolja a tárgyszavakat, esetleg a tárgyszavaik szinonimáit is, melyekről utal az érintett tárgyszavakra. Visszaidézve az elvárásokat, egy tárgyszórendszernek és az általa végzett tárgyszavazásnak az alábbi követelményeknek kell megfelelni: − a fogalmak egyértelmű jelölése, − a fogalmak (IKNY-szavak) áttekinthetőségének biztosítása,
INFORMÁCIÓKERESŐ NYELVEK II. − a keresés mélységbeni rugalmassága, − indexkifejezések közötti értelmi összefüggések kimutatása, − a specifikusság elvének érvényesítése, − az újdonságot jelentő információtartalmak feltárásának képessége, − a relációmegelőző transzformáció biztosítása, − a sokszempontú, kombinált keresés segítése, − egyszerű, könnyű, kényelmes használat biztosítása, − a feldolgozás/keresés költséghatékonyságának biztosítása. Az előző leckében megtanultuk, hogy következetesen el kell végezni a tárgyszavak nyelvi (alaktani, szótani) szabályozását, biztosítani a szinonimák következetes jelölését, és bevezetni a logikai szabványosítás megfelelő szintjét. Csak ezen az alapon lehetséges a következetes, egységes tárgyszavazás lexikális feltételeinek biztosítása, különösen akkor, tekintettel arra, hogy az adatcsere (rekordok átvétele és átadása) követelményeit is ki kell elégíteni. A fentiekhez kapcsolódva két kérdéskört kell a továbbiakban részletesebben vizsgálnunk: (1) a tárgyszókategóriák meghatározása, (2) a tárgyszavas indexelés elveinek és szabályai. 6.3.2.
A tárgyszókategóriák A tárgyszókategóriák áttekintése
Egy tárgyszórendszer tervezése során az első kérdés, hogy mi lehet tárgyszó? A tárgyszavak körének megfogalmazása során tekintetbe kell venni az összes lehetséges tárgyszókategóriát: a tematikus, személyi, földrajzi, idő, formai tárgyszavakat. 14. A tárgyszókategóriák bemutatása példákkal
Tárgyszókategória és alkategóriák
Példák
Tematikus tárgyszavak Tudományos fogalmak Tudományos, művészeti irányzatok, iskolák, stílusok A tudományok gyakorlati alkalmazásai Tudományos műszavak, terminus technikusok Szellemi termékek, műfajok Egyes szellemi alkotások Anyagok, dolgok, eszközök, termékek Konkrét eszközök, konkrét termékek, konkrét objektumok Növények, állatok (általában és konkrétan)
Értéktörvény (közgazdaság) Bradford-törvény Impresszionizmus Freudizmus Hitelügy Kamatláb, Impakt-faktor Mesefilm Biblia Arany, Személygépkocsi, Bor Mazda Búza, Béka 77
INFORMÁCIÓKERESŐ NYELVEK II. Folyamatok, változások, történések, események Személyi, intézményi, testületi tárgyszavak Egyes személyek Személyek csoportjai, életkorok, nem stb. szerint Társadalmi osztályok, rétegek Intézmények, testületek, szervezetek típusai és konkrét példái Népek, nemzetiségek Földrajzi tárgyszavak Kontinensek, országok, megyék, városok, bármely közigazgatási egység Természetföldrajzi képződmények: hegyek, folyók, tavak stb. Időtárgyszavak Időszakok, periódusok Konkrét időtartamok, század, évtized, év stb. Formai tárgyszavak A dokumentum formájára utaló tárgyszavak
Földrengés, Háború Dewey, Melvil; Széchenyi István; stb. Nők, Gyermekek, Idősek stb. Értelmiség Magyar Internet Egyesület Kínaiak, Oroszok Európa, Magyarország, Vas megye, Pécs Bakony, Duna, Balaton stb. rézkor, aranykor, hét, hónap, vasárnap stb. 19. század, 1999, 2010. január 1. stb. disszertáció, kutatási jelentés, szöveg-gyűjtemény, antológia stb.
A tárgyszókategóriák és a tartalmi feltárás adatmezői A tárgyszókategóriákra, tárgyszótípusokra számos szabályozás született, nagy részük a bibliográfiai leírási szabványok keretében. Elengedhetetlen, hogy ezekre is tekintettel legyünk az elemzés során, hiszen segítségükkel válhat a munka következetessé, összehangolttá, pontossá, precízzé, és megbízhatóvá. Nézzük meg részletesen a tárgyszavakat és szabályozásuk területeit. A bibliográfiai leírás adatcsere-formátumával kapcsolatos szabálytervezet (2002) tekintettel volt a tartalmi adatmezőkre, azok szabályozásának szükségességére. A tartalmi feltárás adatmezői „rímelnek‖ a fenti – Ranganathanig visszamenő – kategóriákkal, sőt még differenciáltabbak is annál. A fenti sorrendet megtartva, kiegészítve, differenciálva vizsgáljuk meg, hogy a HUNMARC szabványban milyen mezők szolgálnak a tárgyszavak szabványos kifejezésére. Tematikus tárgyszavak A tematikus tárgyszavakkal (illetve a minden kategóriát magában foglaló tárgyszavakkal) hozható kapcsolatba a 650 mező, mely a tárgyszórendszerből származó tárgyszavakat tartalmazhatja. Ehhez kapcsolódik a 630 egységesített cím- tárgyi melléktétel mező. Személyi, intézményi tárgyszavak A személyi és intézményi tárgyszókategóriákkal kapcsolatba hozható a személynév tárgyi melléktételeket tartalmazó 600 mező, a testületi név tárgyi melléktételeket tartalmazó 610, a rendezvénynév tárgyi melléktételeket tartalmazó 611 mező. Földrajzi tárgyszavak
INFORMÁCIÓKERESŐ NYELVEK II. A földrajzi tárgyszókategóriával kapcsolatba hozható a 651-es mező, mely a földrajzi név tárgyi melléktétel mezője. Formai tárgyszavak A formai tárgyszókategória felhasználható mezője a 655-ös, mely a formai tárgyszavaknak (a dokumentum műfaja) ad helyet. Mindezekhez kapcsolódik a 657 dokumentum célja, rendeltetése tárgyszó mező, a 656 foglalkozás tárgyszómező, a 658 oktatási tárgyszó mező. Ld. részletesen HUNMARC bibliográfiai formátum elemzésében32 Ehhez kapcsolódik a MOKKA HUNMARC rekordot bemutató segédlet is.33 A tárgyszókategóriák sajátos jellemzői Tematikus tárgyszavak Ez a legszélesebb kör, a leggyakrabban használt tárgyszókategória. Gyakori gond az egyértelmű értelmezés – vannak „puha‖ tudományok, ahol bizonytalanak, kevésbé egyértelműek a tárgyszavak, pl. Posztmodernizmus, szocialista realizmus stb. Gyakran szükséges magyarázó, útbaigazító szöveg a használat körülhatárolására. Így jár el számos esetben az OSZK-tezaurusz/Köztaurusz is. Az orvostudomány, biológiai tudományok, csillagászat stb. előnyben részesítik a nemzetközileg egységes, rendszerint latin megnevezéseket. A szakkönyvtárnak, tájékoztatási szervezetnek alkalmaznia kell a tudományban használt terminológiát. A Könyvtárosok kézikönyve szerint kerülni kell a viszonylagos jelentésű, labilis vagy eltérő értelmezéseket megengedő tárgyszavak felvételét, pl.: „Kortárs zene‖, a „modern‖ jelző, a politikailag labilis kifejezések, pl. a „Jobboldali pártok‖ vagy „Baloldali pártok‖, a „nacionalizmus‖, mind attól függ, ki minősít, hogyan magyarázza, értelmezi. A felvett kifejezéseknél a szinonimákról utalásokkal, a tárgyszavakhoz fűzött magyarázatokkal fokozható, hogy a tárgyszó egyértelműen képviseljen egy adott fogalmat. A bibliográfiai leírás adatcsere-formátumával kapcsolatos szabálytervezet (2002) szerint a 650-es mező a tárgyszórendszerből vett tárgyszó mezője. Itt kap helyet: „A dokumentum tartalmát szakterületi szempontból jellemző tárgyszó/deszkriptor (tartalmi ismérv), amelyet a megfelelő szakkifejezésből – vagy egymáshoz közel álló szakkifejezésekből – kiindulva tárgyszóként/deszkriptorként szabványosítottak és tárgyszójegyzékbe/tezauruszba fölvettek. A HUNMARC szerinti katalogizálási tudnivalók alkalmazását segíti Barki Katalin és Prejczer Paula segédlete.34
32
HUNMARC Bibliográfiai Formátum funkcionális analízise. HUNMARC bibliográfiai formátum – FRBR megfeleltetés. URL: http://www.oszk.hu/hun/szakmai/hunmarc/HM_FRBR_Tabla1.pdf 33 A MOKKA HUNMARC rekordja. Bibliográfiai rekordok. A tartalmi feldolgozás mezői. Katalogizálási segédlet, 2006. Összeállította: SZABÓ Julianna. URL: http://www.mokka.hu/files/HUSwebre/MORChu/TARhm.doc 34 BARKI Katalin, PREJCZER Paula: Számítógépes katalogizálás HUNMARC formátumban. Az elektronikus változatot szerk. BARKI Katalin. Szombathely, 2003. URL: http://www.bdtf.hu/konyvtar/oktatas/marc/index.htm
79
INFORMÁCIÓKERESŐ NYELVEK II. Besorolási adatmezők a bibliográfiai rekordban 15. Besorolási adatmezők a bibliográfiai rekordban
Besorolási adatmezők a bibliográfiai rekordban X00 – Személynév X10 – Testületi név X11 – Rendezvénynév X30 – Címek 65X – Tárgyszó 651 – Földrajzi név 6.3.3. A tárgyszavas indexelés és szabályozása Az indexkifejezések és indextételek A tárgyszavazás eredménye, terméke a tárgyszavas indextétel. Ennek elkészítése érdekében a tárgyszavakat (tárgyszavas indexkifejezéseket) rendszerbe kell szervezni, az azok egymáshoz kapcsolásával, az indextétel felépítésével kapcsolatos szabályokon alapulva. A tárgyszavazás (más szóval tárgyszavas indexelés) 3 fő feladata A tárgyszavazás lényeges ismérveiből következik a 3 fő elvárás: (1) A szabályozott tárgyszavas keresőnyelv szavaival írja le a dokumentumok /ismeretegységek lényeges vonásait. (2) Tegye lehetővé a keresést és a böngészést a szükséges tárolási-keresési rendszer kidolgozásával (pl.: OPAC, bibliográfia, adatbázis stb. tárgyszóindexe alapján). (3) Tegye lehetővé a felhasználók számára a keresőképek (keresőkérdések) leírását, a keresés témáinak a leírását is. A tárgyszórendszer azért van, hogy segítse az indexelést, az indextételek létrehozását a benne szereplő indexkifejezések alapján. A PRECIS index alapvető tanulsága: nem elegendő, hogy egy rendszer kulcsszavak, tárgyszavak halmazával rendelkezik – szintaktikai (mondatalkotási) szabályrendszert (is) ki kell dolgozni és alkalmazni. Ennek a szabályrendszernek az alkalmazásával – a tárgyszóelemek egymáshoz rendelésével (koordinálásával) az adott szövegben élő összefüggéseket át lehet és kell menteni, ábrázolni az indextételekben. Az indextétel az ismeretegységhez rendelt ismérvek csoportja, a szurrogátum egyik alkotó része. A tárgyszavas indextételt több tárgyszó együttesen alkotja, ezek a tárgyszavas indexkifejezések. Az indexkifejezések szintaktikai szabályok szerint állnak össze indextétellé. Az indexelés szabályaival a Könyvtárosok kézikönyve is bőségesen foglalkozik.35. Az 1970-es évekig a szintaktikai relációk (mondatképző szerep-, illetve kapcsolatjelölők) kidolgozásával kísérelték meg megoldani azt, hogyan őrizhetők meg az információkeresés számára a szavak szövegen belüli összefüggései, hogyan lehet mondattanilag repre35
HORVÁTH Tibor, SÜTHEŐ Péter: i.m.
INFORMÁCIÓKERESŐ NYELVEK II. zentálni. Az intellektuális feldolgozás terén William J. Perry, Jason L. Farradane, Jean M. Perreault, Derek Austin és mások (a felsorolt szerzők szemelvényei UNGVÁRY Rudolf és ORBÁN Éva Kommentált szöveggyűjteményének első kötetében találhatók. Az indexelés alapelvei és példái Az indexelés hatékonyságát növelni kell. Az indexelésnek a lehető legjobban kell tömörítenie az eredeti ismeretegység tartalmát, hogy a lehető legjobban emelje ki annak lényegét. Az eredeti szöveghez képest az indextétel mindig redukáltabb, szegényebb, az indexelés mindig veszteséggel jár. Bizony, nagy különbség van, mondjuk kedvenc regényünk, illetve annak regénykalauzos változata között. Mit várhatunk el egy indextételtől? − (1)Legyen benne olyan magasabb szintű rendező elv (szabály, szintézis), mely egyértelműen összegzi (sűríti, reprezentálja) az eredeti dokumentumot, mely a tárgyszavakat valódi indextételbe, következetesen ábrázolt egységes egészbe fogja öszsze (mint a PRECIS rendszer esetében). − (2)Legyen következetesen indexelt – ragaszkodva a megfogalmazott szabályokhoz, (elvárásokhoz, követelményekhez). A lényeg, hogy a saját magunk által megfogalmazott szabályokat következetesen tartsuk be. − (3) Szövegösszefüggés megőrző transzformáció érvényesítése – úgy vigyük át az eredeti szöveget (forrásszöveget) a reprezentációba (az indextételbe), hogy a tárgyszavak között azok a relációk (szövegösszefüggések) maradjanak érvényesek, amelyek az eredeti szövegben érvényesek, – az indextétel őrizze meg az eredeti szöveg fogalmai között létesített összefüggéseket. − (4).A specifikus tartalom tükrözése – Cutter fogalmazta meg követelményként, hogy „minden művet saját tárgyszava alatt kell felvenni, nem pedig annak az osztálynak neve alatt, amely a tárgyat magában foglalja.‖ (Szilágyi Tibor fordítása. Szilágyi 1968.) Ha egy könyv a versenylóról szól, a tárgyszó legyen versenyló, ne Állatok, Zoológia, vagy Ló. Ha a Kincsem versenylóról van szó, akkor a tárgyszó legyen Kincsem (versenyló) (ahogy az Új Könyvek tárgyszórendszer teszi.) A követelmény logikus, és könyvtárak, különösen szakkönyvtárakban, de minden könyvtártípusban igyekeznek annak megfelelni, de nem mindig teljesíthető a természeti és társadalmi valóság által produkált fogalmak és tárgyak változatossága miatt. A Berzsenyi Dániel Főiskola Médiatárának a katalógusa, majd a Központi Könyvtára OPAC-ja jó példa volt erre a specifikus feltárásra: a video dokumentumok analitikus tartalmi leírása 30 tárgyszót tartalmazott dokumentumonként. Ennek oka az volt, hogy az 1990-es évek elejéig 3-4 perces „snitteket‖ – ismeretegységeket tártak fel a videofilmeken belül, hogy a szaktantermekben bejátszhassák pl. a kacsacsőrű emlőst, amikor a tanár éppen annak táplálkozási szokásait mutatja be. A videostúdió megszűnt, a specifikus alkalmazás okafogyottá vált. Az indextétel a teljes feldolgozási tételre vonatkozik. Az indexkifejezés ennek alkotóeleme, pl. valamely kategóriához tartozó tárgyszó. A tárgyszórendszer elemei (a potenciális indexkifejezések) közötti kapcsolatok rögzítése a tárgyszórendszerben nagyon fontos, mert segíti a differenciáltabb, következetesebb feldolgozási (indexelési), és ezáltal keresési folyamatot. 81
INFORMÁCIÓKERESŐ NYELVEK II. Az indextétel elemeinek rendje A PRECIS indexelési rendszer szerint a természetes nyelv mondatainak analógiájára kell megoldani a lexikai egységek mondatszerű láncba szervezését. Horváth Tibor tanulmányában a PRECIS indexelési rendszer tanulságaira alapozva, hangsúlyozza, hogy minden dokumentumban, ismeretegységben megragadható: − valamilyen cselekvés, folyamat, történés, pl. kísérlet, növekedés, szervezés stb., − a cselekvés tárgya, akire, vagy amire a cselekvés irányul, − a cselekvés alanya, további a cselekvő, végrehajtó személy, vagy közeg, − ezek kiegészítői (komplementumai) (Dahlberg nyomán pl. hely, idő stb.) 36 A fentiek alapján meghatározható a mondaton belüli hely. A szabályok meghatározhatják az indextételben szereplő elemek sorrendjét (az indextétel kialakítását is vezérelve). Az indextétel a keresés oldaláról kétféle tárgyszóból áll: elérési ismérvként szerepeltetett, ill. nem-elérési ismérvként szerepeltetett. Az indextétel sorrendjében is egyértelműnek kell lenni, hogy egy tárgyszó egyben elérési ismérv is. A szövegösszefüggéseket visszaadó tárgyszó-indextételek megszerkesztéséhez különböző kiindulópontok lehetnek: − A PRECIS indexelési rendszer (lásd bővebben 2/4. lecke) alapján a természetes nyelvre emlékeztető mondatok születnek, a cselekvés, a dolgok és a folyamat körülményeinek és egyéb ismérveknek az elemzésével és kifejezésével. − A permutált tárgyi indexelési rendszer alapján az indextételben levő elemek közül a permutációs eljárás következtében egyszer mindegyik keresőpozícióba kerül, s ily módon egy tárgyszólánc többszöri besorolásra kerül („tárgyszó szövegkörnyezetben‖), ami nyomtatott kiadványokban, de böngésző üzemmódban is igen hasznos lehet. − a német tárgyszórendszer indexelési elvei szerint szabályozott, hogy az egyes kategóriákhoz tartozó tárgyszavak a legfeljebb 6 elemből álló tárgyszóláncban (1 főtárgyszó.- 5 altárgyszó), hol jelennek meg a láncban (pl. az indextétel első helyén a személyi tárgyszó áll.) − A Kongresszusi Könyvtár indexelési szabályrendszere szerint a főtárgyszavak után különböző altárgyszavak állnak meghatározott sorrendben. Ezek az altárgyszavak módosítják vagy konkretizálják a fogalom jelentését az adott összefüggésnek megfelelően. − Ranganathan indexelési szabályrendszere is meghatározott keretrendszerben érvényesül. Mind az öt megoldásnak vannak igazolt előnyei, amiért választották és használják. Fontos a megfogalmazott szabályok következetes betartása.
36
HORVÁTH Tibor: Az általános tárgyszójegyzék munkálatairól = Könyvtári Figyelő, 2. (38.) évf. 1992. 610– 617. p
INFORMÁCIÓKERESŐ NYELVEK II. Az indexelés lépései és szintjei Ranganathan szerint A tárgyszavazás indexelés során az egyes lépések egyrészt a fogalmi és nyelvi szintek követésében, másrészt Ranganathan osztályozási lépéseiben követhetők. Kell egy szisztéma, ami alapján minden egyes dokumentum tartalmát hasoló lépésekben tárjuk fel, ugyanazon elemzési keretben. A dokumentum „nyers címe‖: Audiovizuális oktatási módszerek a középiskolákban. 16. A tárgyszavazás fogalmi, nyelvi, jelzetelési szintjei Ranganathan alapján
Lépések a nyerscím (eredeti cím) 1. a kifejező (feldúsított) cím
A lépés eredménye: Audiovizuális oktatási módszerek a középiskolákban. Audiovizuális oktatási módszerek a japán középiskolákban az 1990-es években Audiovizuális oktatási módszerek. Középiskolák. DélJapán. 1990-es évek Audiovizuális oktatás módszerek (1MM1). Középiskolák ( ) Dél-Japán. 1990-es évek az adott IKNY szabályainak megfelelően történik
2. a magcím – alapvető fogalmakra redukált cím 3. A fogalmi tükrözés szerint elemzett cím 4. a sorrendi szabálynak megfelelően átrendezett cím 5. a szabályozott szótárú Audiovizuális oktatási módszerek. Középiskolák. Japán IKNY szókészlete szerinti cím – Dél-Japán, 20. sz. 6. a cím magszámokban 7. osztályozási jelzet/indextétel Audiovizuális oktatási módszerek – Középiskolák – Japán – Dél-Japán, 20. sz. A mellékelt bibliográfiai rekord a fenti alternatívák közül a Kongresszusi Könyvtár indexelési módszeréből a prekoordinált tárgyszavazási megoldását szemlélteti. Figyelemreméltó az is, hogy a Debreceni Egyetem Nemzeti és Egyetemi Könyvtára két nyelven is megadja a tárgyszavakat, angolul és magyarul (mindkettőt természetesen a Kongresszusi Könyvtár tárgyszórendszere alapján.
21. kép
Kongresszusi Könyvtár tárgyszórendszere Debreceni tárgyszavazási példa 83
INFORMÁCIÓKERESŐ NYELVEK II. Fontos hangsúlyozni, hogy a debreceni könyvtár tárgyszó-adatbázisában egyaránt naprakészen fellelhetők mind a magyar, mind pedig az LCSH-tárgyszóalakok. 6.3.4.
Tárgyszavak előzetes vagy utólagos egymáshoz rendelése A tárgyszavak előzetes egymáshoz rendelése
Ungváry Rudolf prekoordinált, ill. posztkoordinált tárgyszóalkalmazást különböztet meg.37 Az indexelés során a tárgyszavakat egymáshoz rendelve, meghatározott szabályok szerint indextételbe szervezhetjük. Ez a prekoordinált szerkezetű tárgyszavak fő ismérve, az összetett tárgyakat többnyire eleve egymáshoz kötött fő-, al- és melléktárgyszavakkal fejezi ki, s ezek külön egymással nem kombinálhatók. Ez a Cutter által bevezetett, hagyományos szerkezet, mely alatt pl. a Kongresszusi Könyvtár katalógusában, illetve a Debreceni Egyetem Egyetemi és Nemzeti Könyvtárában találkozhatunk, pl. Bibliográfia, Régi nyomtatványok, 16. század – Művészet – Lexikonok A megoldás előnye, hogy böngésző üzemmódban a komplex témakörök szisztematikusan és jól áttekinthetők. A fentiekhez kapcsolódik az a tény, hogy magában a tárgyszó-adatbázisban, is alárendelt formában szerepelnek ezek az egymáshoz rendelt formák. A tárgyszavak utólagos egymáshoz rendelése E megoldás fő ismérve, hogy önállóan alkalmazható természetes nyelven alapuló osztályozó-indexelő kifejezésekről (posztkoordinált szerkezetű tárgyszavakról) van szó. Fő ismérve, hogy önállóan alkalmazható természetes nyelven alapuló osztályozóindexelő kifejezésekről van szó. E tárgyszavakat nem rendeljük eleve egymáshoz, egymástól függetlenül adjuk meg és a tárgyszavak a keresés során egymással szabadon kombinálhatók. Példák: − Bibliográfia − Régi nyomtatványok − 16. század − Művészet − Lexikonok A böngészőben alkalmazva viszont az egyes tárgyszavak önmagukban állnak, mivel nincsenek egymáshoz rendelve másokkal. Ezért böngészőben előfordulhat, hogy pl. a Bibliográfia tárgyszó után akár „2316 „találat‖ szerepel! A tárgyszavak permutálása A permutált tárgyszóláncból valamennyi (előre ki nem zárt) alkotóelem besorolásielérési helyzetbe kerül. A tárgyszavak forgatásával egymást értelmező láncok keletkeznek. A láncokban a sorrend nem változik, csak a besorolás (elérés) helyei módosulnak. Az alkotóelemek a láncban úgy viselkednek, mintha nyelvtani esetek kötnék össze őket. 37
UNGVÁRY Rudolf. URL: http://www.mvkkvar.hu/tezaurusz/tezkozt.html#tez
INFORMÁCIÓKERESŐ NYELVEK II. Példa: − Irodalomelmélet – Olaszország – Reneszánsz − Olaszország – Reneszánsz – Irodalomelmélet − Reneszánsz – Irodalomelmélet – Olaszország − (forrás: Új Könyvek tárgyszójegyzék) Előfordulhat, hogy a permutációból a tárgyszólánc egy vagy több elemét kizárják, de ilyenkor is szükséges, hogy hivatkozás történjen. Példa: − Anglia – Munkásosztály – Művelődéstörténet 1920–1955 − Munkásosztály – Anglia – Művelődéstörténet 1920–1955 − Művelődéstörténet lásd még az egyes országok, közigazgatási egységek neve alatt 6.3.5.
A fejlesztés öt alapkérdése
Öt alapkérdés vetődik fel: (1) Kiknek a szóhasználatára kell figyelni? − A tárgyszórendszer szolgálhat széles körű felhasználói igényeket, vagy egy speciális szakma, tudományterület művelőinek igényeit. A tárgyszavaknak tükrözni kell az adott szakterület mérvadó dokumentumainak (azaz az adott szakterület művelőinek) a szóhasználatát. (2) Hogyan alakuljon a tárgyszavak tematikai köre? − Az általános vagy speciális gyűjtőkörnek általános vagy speciális tárgyszórendszer felel meg. Az enciklopédikus gyűjtőkörű könyvtárak általános, valamennyi ismeretágat lefedő tárgyszókészletet, általános tárgyszórendszert igényelnek. A részterületekre szakosodott gyűjtemények olyan szakterületi tárgyszórendszerekkel dolgoznak, melyek egy-egy szakterület, diszciplína specifikus tárgyszavait foglalják rendszerbe. (3) Milyen mértékben fedje le a tárgyszórendszer az adott tudományt, szakterület? − A tárgyszórendszer hézagtalanul fedje le az adott szakterület, tudomány tartalmát. Biztosítsa a terület vagy tudomány olyan tartalmi feldarabolását, amely áttekinthető egységet eredményez, mely segíti az ismeretek áttekinthető részletezését, a keresőrendszerben áttekinthető mennyiségű találat nyújtását. (4) Egyedül vagy együtt építsük, fejlesszük a tárgyszórendszert? − A közös katalógusok és dokumentumellátási rendszerek világában követelmény a tárgyszavazás terén való együttműködés, tárgyszórendszerek közös alkalmazása, fejlesztése. Ez már kezd bevett gyakorlattá válni, és szerepel a MOKKA 2010-ben megfogalmazott fejlesztési tervei között is. 38 − Együttműködés esetén a tárgyszó forrásai között meglevő rendszerekre is támaszkodhatunk, pl. a Library of Congress Subject Headings (LCSH), a Medical Subject Headings (MeSH), valamely, Magyarországon már kidolgozott tezaurusz vagy 38
A MOKKA közös katalógus továbbfejlesztése. Szakértői vélemény. Munkaanyag. 2010.03.23. Készítette a MOKKA szakértői munkacsoportja. 193 p. URL: http://www.mokka.hu/files/tamop/A_MOKKA_tovabbfejlesztese_5_20100323.pdf
85
INFORMÁCIÓKERESŐ NYELVEK II. tárgyszórendszer, pl. az OSZK-tezaurusz/Köztaurusz. Bármilyen együttműködés esetén ismerni kell a rekordok exportálási-importálási technikáját (MNB, MOKKA, KELLO, Aleph, Textlib adatbázisok stb.) − Amennyiben magunk építjük, akkor különösen fontos gondoskodni arról, hogy álljanak rendelkezésre a meghatározott források: lehetőleg tárgyszóadatbázis formájában, az értelmező szótárak, az általános és szaklexikonok, referenszkönyvek, a tezauruszok, és természetesen az authority fájlok. (5) Mire ügyeljünk a tárgyszórendszer gondozása, naprakészen tartása során? − Ha egy új tárgyszót vezetnek be, az azonnal jelenjen meg a tárgyszórendszerben (kapcsolataival, szinonimáival, magyarázatokkal együtt) mind a feldolgozás (feldolgozó szakember), mind a keresés (felhasználó) számára. Egy tárgyszórendszer sohasem lehet teljesen kidolgozott, „kész‖, még a Kongresszusi Könyvtár tárgyszórendszerében is vannak „hézagok‖, fontos új fogalmak se tárgyszó, se utaló formájában nem jelentek még meg. A naprakészen tartás csak folyamatos, rendszerszerű fejlesztéssel valósítható meg. Fontos, hogy a terminológiai változások követése (új fogalmak keletkezése, mások elavulása miatt) elektronikusan, illetve ahhoz kapcsolódva, ha lehetséges, nyomtatott módon is történjen. A kifejlesztett tárgyszórendszert számítógépes adatbázisban kell tárolni, és hozzáférhetővé tenni a belső és külső érintettek számára. A rendszer használatának következetesnek, lehetőség szerint egységesnek kell lennie (pl. a Kongresszusi Könyvtár tárgyszórendszere világszabványként is felfogható).
6.4
ÖSSZEFOGLALÁS
A tárgyszavazás alapjai elsajátításának második részében megismerte a tárgyszólista, illetve a tárgyszórendszer közötti különbségeket, és tisztában van az utóbbival szembeni követelményekkel, megismerte annak összetevőit, összefüggéseit. Tisztában van a tárgyszókategóriákkal, azok jellemzőivel, azzal, hogy azok nagy vonalakban visszatükrözik az általános fogalmi kategóriák alkategóriáit (személyi, tárgyi, folyamat, hely, idő, dokumentumforma). Megismerte, hogy a bibliográfiai rekord adatmezőjében milyen helyet kapnak az egyes tárgyszókategóriák a HUNMARC szabvány szerint. Elsajátította a szövegösszefüggések ábrázolásához (indexeléséhez) szükséges alapfogalmakat (tárgyszavas indexelés, eredménye a tárgyszavas indextétel, összetevői: a tárgyszavas indexkifejezések.) Megismerte az indexelés alapelveit, lépéseit, az indextételen belüli sorrend lehetséges alternatíváit, jellegzetes példáit.(PRECIS szerinti indexelés, Ranganathan módszere stb.) Áttekintést nyert a tárgyszó karbantartási és szabályozási folyamatának különféle vetületeiről és eszközeiről, a rendszerfejlesztés öt legfontosabb kérdéséről. Összességében megszerezte azokat az alapismereteket, melyekre építve képes konkrét tárgyszórendszerek szisztematikus elemzésére, értékelésére.
INFORMÁCIÓKERESŐ NYELVEK II.
ÖNELLENŐRZŐ KÉRDÉSEK
6.5 1.
Idézze el a tárgyszólista és a tárgyszórendszer közötti hasonlóságokat, különbségeket!
2.
Adjon átfogó áttekintést a tárgyszókategóriákról!
3.
Ismertesse egyes tárgyszókategóriák sajátosságait!
4.
Világítsa meg a tárgyszókategóriák, illetve a tartalmi feltárás adatmezői közötti összefüggéseket!
5.
Miben látja a szabályozás szerepét a tárgyszavas indexelés területén?
6.
Fejtse ki az indexelés, indexkifejezés, és indextétel összefüggéseit!
7.
Fejtse ki, mi határozza meg az indexkifejezések rendjét az indextételben?
8.
Melyek az alapvető különbségek a tárgyszavak előzetes, vagy utólagos koordinálása között?
9.
Adjon rövid áttekintést a fejlesztés öt alapkérdéséről!
10. Világítsa meg részletesebben a tárgyszórendszer gondozásának követelménye-
it!
87
INFORMÁCIÓKERESŐ NYELVEK II.
7. NEMZETKÖZI TÁRGYSZÓRENDSZEREK: LCSH, SWD/RSWK 7.1
CÉLKITŰZÉS
A lecke feldolgozásával legyen képes − a Kongresszusi Könyvtár tárgyszórendszerével (LCSH) kapcsolatos részletek kifejtésére, − a tárgyszórendszer lényegi jellemzőinek kifejtésére, − az elterjedésével kapcsolatos okok kifejtésére, − a tárgyszórendszer részeinek, azok funkcióinak elemzésére, − az indexelési szabályok kifejtésére, gyakorlati példákon keresztül − a tárgyszórendszer fejlesztésével kapcsolatos eszközök és módszerek bemutatására, − a Kongresszusi Könyvtár online katalógusában tárgyi keresésre, − a további nemzetközi fejlemények felvázolására, − a német tárgyszórendszer és szintaktikai szabályrendszer (SWD/RSWK) részletesebb kifejtésére
7.2
TARTALOM
1. A LCSH tárgyszórendszer fejlődéstörténete és jellemzői 2. A tárgyszórendszer részei, tárgyszóalakjai, tárgyszókategóriái – A tárgyszórendszer részei – A tárgyszavak nyelvi szabályozása – Tárgyszókategóriák 3. A tárgyszókapcsolatok jelölése – Bevezetés – Példa a kapcsolatok jelölésére – Az online kereséshez megjelenített tárgyszótétel 4. Tárgyszóindexelési szabályok – Tárgyszavazás alosztályozással – Tárgyszavas böngészés az online katalógusban – A találatok megjelenítése, a bibliográfiai rekordok 5. A tárgyszórendszer fejlesztése – A rendszerfejlesztés nem áll(hat) meg – A rendszerfejlesztés szervezési technikái 6. A tárgyszavazás fejlesztésének további nemzetközi példái – A brit és francia nemzeti könyvtár – A német tárgyszórendszer és szabályzat – A MACS Projekt
INFORMÁCIÓKERESŐ NYELVEK II.
7.3
A TANANYAG KIFEJTÉSE
7.3.1 A tárgyszórendszer fejlődéstörténete és jellemzői A LCSH a washingtoni Kongresszusi Könyvtár tárgyszórendszerének (Library of Congress Subject Headings) népszerű rövidítése. A világ legismertebb és legnagyobb általános tárgyszórendszere. E rendszer egyszerre globális rendszer és magyar rendszer is, magyar gyűjteménye kb. 150000 dokumentumot fog át! A Kongresszusi Könyvtár 1897-ben kezdte el „a tudományok és a gyakorlat egészét felölelő‖ tárgyszórendszer fejlesztését. Hasonlóan a Kongresszusi könyvtár osztályozási rendszeréhez (LCC-hez), a tárgyszórendszer esetében is Charles A. Cutter kezdeményezéseit követték, amelyeket a Rules for a dictionary catalog című művében fogalmazott meg. Széles körben használják az előzetes katalogizálásban is. Voltak időszakok, amikor gondok voltak, pl. az 1980-as évek elején, a tárgyszórendszer és az indexelés elvei azóta dinamikusan fejlődtek, hála az világméretű együttműködésnek is, Észak-Amerikától Ausztráliáig, Nagy Britanniától Debrecenig. Magyarországon a Debreceni Egyetemi és Nemzeti Könyvtár (DEENK) használja a rendszert tárgyszavazásra angol, illetve magyar nyelvi változatban. A rendszer lényegi jellemzőiről, az 1990-es évek eleji fejlesztéséről ad áttekintést Rónai Tamás tanulmánya.39 Napjainkban még intenzívebbé vált a módszertani fejlesztés, az infokommunikációs technológiák adta lehetőségeknek. Már a 31. kiadásnál tartanak és 2010 őszén jelenik meg a 32. kiadás. A kiadások közötti időközökben a heti listákat lehet elektronikusan elérni.40 Az LCSH méreteit jelzi, hogy összességében 2008. évi adatok szerint 308 000 tárgyszót és hivatkozást foglal magában. Az előző, 2007. januári kiadáshoz képest 17 000 új tárgyszavat vett fel, illetve 16 000 tárgyszót módosított. Külön hangsúlyt helyez a gyermek igényeit szolgáló tárgyszófejlesztésre is. Az egyetlen tárgyszórendszer jelenleg, amelyet világszabványként fogadnak el. Globális integráló szerepét elismerve, az angol nyelvterületen kívüli könyvtárak is bekapcsolódtak a használatába. Közismert, hogy az USMARC-szabvánnyal való szoros kapcsolata révén főleg az amerikai fejlesztésű rendszerekben az LCSH személyi, testületi és földrajzi neveit besorolási (authority) adatként kezelik. (a fejlesztési vonatkozásokat ld. bővebben a lecke 6. pontja alatt). 7.3.2 A tárgyszórendszer részei, tárgyszóalakjai, tárgyszókategóriái A tárgyszórendszer részei Az LCSH elméletileg három fő részből áll: (1) a szabványos tárgyszójegyzékből, mely az indexelés alapjául szolgál – 39
RÓNAI Tamás: Az amerikai és német tárgyszórendszerekről = Könyvtári Figyelő, 40. évf. 1994. 2. sz. URL: http://epa.oszk.hu/00100/00143/00010/ronai_h.html 40 Library of Congress Subject Headings. Weekly List. 2010. URL: http://www.loc.gov/catdir/cpso/wls10/awls1003.html
89
INFORMÁCIÓKERESŐ NYELVEK II. (2) a nyitott szótárból, mely gyakorlatilag az angol nyelv szókészlete, s a szabványos tárgyszójegyzéken kivüli forrásokat képviseli, (3) az LCSH-tól független LCC osztályozási jelzetekből, mellyel konkordanciajegyzék köti össze. A „szűkebb‖ tárgyszórendszer tartalmazza a tárgyszavakat, azok kapcsolatainak feltüntetését, beleértve a magyarázatokat, a szinonimákat, és a különféle logikai-szemantikai kapcsolatokat. A szabványos tárgyszójegyzék a tárgyszavakat, az utalásokat, a magyarázatokat, és a tárgyszavak közötti kapcsolatokat foglalja magában. Az LCCH szerinti indexelés ezekre a nyelvi és logikai szempontból szabályozott tárgyszavakra épít. Tárgyszavak nyelvi szabályozása A nyelvi szabványosítás eredményeképpen az LCSH tárgyszavai az alábbi tárgyszóvagy kifejezéstípusokba sorolhatóak: 17. Tárgyszóalakok a Kongresszusi Könyvtár tárgyszórendszerében
Tárgyszóforma Egy szóból álló tárgyszó Összetett tárgyszó Két tagú kifejezés Jelzős főnév Főnév+főnév (az első melléknévi szerepben) Főnév+prepozíció+főnév Főnév+ hátravetett melléknév Főnév+ főnév Többtagú kifejezés Értelmezővel ellátott főnév
Példák Skating Hungary Catalogs Lifeboat Administrative law Arab countries Information society Energy industries Radioisotopes in cardiology Children in literature Asia, Central Children and animals Libraries and society Show driving of horse-drawn vehicles Drills (Planting machinery)
Tárgyszókategóriák A tematikus, földrajzi, személyi, testületi, formai és időtárgyszavak mind megtalálhatók az LCSH-ban:
INFORMÁCIÓKERESŐ NYELVEK II. 18. Tárgyszókategóriák a Kongresszusi Könyvtár tárgyszórendszerében
Tárgyszókategória Tematikus Földrajzi
Személy, illetve testületi Formai Idő
Magyarázat Főtárgyszavak, de altárgyszavak is lehetnek Helymegjelölő altárgyszavak, a főtárgyszavakat követi, de az indextétel elején is megjelenhetnek Szabadon lebegtetett tárgyszavak „free-floating‖
Példák Agricultural machinery – Russia Hungary Foreign relations Railroads – Hungary – Trains – Statistics United States – History Deaf children Educational Institutions – Hungary – Szombathely – KLTE University Abstracts Dictionaries stb.
Altárgyszavak, a dokumentumok formájára vonatkozó állítások Időpontokat, korszakokat jelölő Education -1945-1964 altárgyszavak
A tulajdonnevek, mint tárgyszavak jelölésére is szabványos MARC authority fájlok szolgálnak, pl. személyek és testületi nevek jelölésére: Personal and corporate names and uniform titles. MARC authority fields 100, 110, 111, 130, A földrajzi nevek jelölésére szolgál a Geographic names. MARC authority field 151. Ez igen fontos, mert a fenti kategóriák gyakran változnak, még az országnevek is, pl. régen: Congo (Democratic Republic) volt, most Zaire. 7.3.3 A tárgyszókapcsolatok jelölése Bevezetés Az LCSH-ban a tárgyszavak közötti logikai kapcsolatokat feltárják, de csak egy szinttel felfelé és lefelé. A tárgyszójegyzékben a fogalmakat képviselő tárgyszavakat a tezauruszokra jellemző szerkezetben, illetve jelöléssel ábrázolják. Megadják az értelmező magyarázatokat, a vele kapcsolatban levő kifejezéseket (a kapcsolat típusának jelölése után), az elvetett, nem kitüntetett szinonimákat, a lásd még utalásokat, valamint a fogalom LCC (Kongresszusi Könyvtár Osztályozási rendszere) jelzetét. Példa a kapcsolatok jelölésére A továbbiakban egy konkrét példán – Agricultural machinery – keresztül mutatjuk be, előbb a kódok szerinti jelölést egy nyomtatott kiadás alapján, majd a felhasználóbarát jelölést, az online katalógus alapján.
91
INFORMÁCIÓKERESŐ NYELVEK II. 19. Tárgyszótétel szerkezete a nyomtatott változatban
A tárgyszótétel szerkezete Agricultural machinery May Subd Geog S671-S760 UF Agriculture- Equipment and supplies Crops- Machinery Farm machinery BT Farm suppl industries Implements, utensils, etc. Tools NT – Agricultural engineering Agricultural implements Agricultural instruments Corn planters (Machines) Cotton planters (Machines) RT Farm equipment Machine-tractor stations SA subdivision Machinery under names of crops, e.g. Corn-Machinery
Magyarázatok A rövidítések magyarázata: May Subd Geog engedélyezi a földrajzi altárgyszavak szükség szerinti használatát UF Used For
preferált fogalom
BT Broader Term
fölérendelt fogalom
NT Narrower Term
alárendelt fogalom
RT Related Term rokon fogalom SA See Also „lásd még‖ utalás
(Részlet a tárgyszórendszer nyomtatott kiadásából) A fenti példában értelmezést is láthatunk, melyet a tárgyszó utáni kerek zárójellel fejeznek ki: Corn planters (Machines) A szinonima kapcsolatok esetén a See (Lásd) utalást használják az elvetett kifejezésről a tárgyszóra. Példa: Repairing See Maintenance. Az LCSH lexikai egységei mellett feltüntetik a Library of Congress osztályozási jelzeteit is. Az online kereséshez megjelenített tárgyszótétel A tárgyszótétel az online katalógusban keresve az egyes tárgyszavak találati halmazainak számát jelző sorban a bal szélső oszlopban a „More Info‖ gombra kattintva jelenik meg. Online tezaurusz-tételként segíti a felhasználót kutatásában, a keresés kiterjesztésében, pontosításában, szempontjainak rugalmas változtatásában. Az LCSH online tezauruszos változata össze van kapcsolva az LCSH alapján indexelt adatbázissal, így a tárgyszóra kattintva közvetlenül találatokhoz juthatunk. A példaként hozott „Agricultural machinery‖ tárgyszótétel megjelenítése az online katalógusban (http://catalog.loc.gov )
INFORMÁCIÓKERESŐ NYELVEK II.
22. kép
Az Agricultural machinery tárgyszótétel összefüggései
Megj.: A Scope note: megjegyzést, a Subdivision pedig alosztást jelent. A Scope note példánkban arra utal, hogy a Agricultural machinery tárgyszó az egyes növények termesztése után a „Machinery‖ alosztás alatt is kereshető, pl. Corn – Machinery [Búzatermesztés – Gépek]). (Megj.: A Kongresszusi Könyvtár katalógusában többféle keresési lehetőség van, (Basic search, guided search, azon belül különféle változatok, köztük a szerző, cím, kulcsszó, tárgyszó, szám, és ezek különféle kombinációi.41 41
Library of Congress Online Catalog. http://catalog.loc.gov/ )
93
INFORMÁCIÓKERESŐ NYELVEK II. 7.3.4 Tárgyszóindexelési szabályok Tárgyszavazás alosztályozással A dokumentumok tartalma ritkán fejezhető ki egyetlen tárgyszóval: a főtárgyszó után altárgyszavakat is használnunk kell. A Kongresszusi Könyvtár, vagy a Debreceni Egyetem Egyetemi és Nemzeti Könyvtára tárgyszó-adatbázisaiban ezek az összetett tárgyszó-alakok is szerepelnek. A tárgyszóláncban fontos szerepe van az alosztályozásnak, ami történhet időtárgyszóval, formai, illetve tematikus tárgyszavakkal, vagy pedig földrajzi tárgyszavakkal. Segítségükkel jól tagolhatók a mindenkori főtárgyszó utáni tételek. Mindez online üzemmódban jól érvényesül. A számítógépes információkeresés koncepciójának a sok belépési és kombinációs lehetőség felel meg, amely a tárgyszavak posztkoordinálásával érhető el. Ezt a Kongresszusi Könyvtár katalógusában is számos eszköz szolgálja. Ilyenek: a tezaurusz-szerkezethez való közelítés, a specifikus deszkriptorok számának növelése, valamint a guided search üzemmód, amelyben két kifejezést kombinálhatunk, de bármelyiket a kettő közül 17 különféle indexre specifikálhatjuk. A tárgyszókategóriáknál utaltunk arra, hogy a tárgyszavak mind fő-, mind altárgyszóként szerepelhetnek. Az alábbiakban ezt példákon keresztül világítjuk meg: Tematikus tárgyszó állhat önmagában is Information society A tematikus tárgyszó az esetek többségében egyéb tárgyszavakkal, altárgyszavakkal egészül ki, pl. földrajzi tárgyszóval Information society – France Személyi tárgyszó önmagában, évszámmal értelmezve: (születési év- elhalálozás éve) Kossuth, Lajos, 1802–1894. [from old catalog] Személyi tárgyszó kiegészülhet különféle altárgyszavakkal, pl. tematikus és földrajzi tárgyszavakkal. Kossuth, Lajos, 1802–1894 --Journeys--United States. Földrajzi tárgyszó ritkán áll önmagában, általában kiegészül, elsősorban tematikus tárgyszóval és időtárgyszóval: United States – Foreign relations – 1783–1865 United States--Politics and government--1865–1933. A földrajzi tárgyszó gyakran egészül ki tematikus tárgyszóval és formai tárgyszóval: United States – Foreign relations – Juvenile literature Földrajzi tárgyszó, kiegészítve tematikus tárgyszóval és földrajzi tárgyszóval: United States – Foreign relations – Japan
INFORMÁCIÓKERESŐ NYELVEK II. A földrajzi nevek olykor invertáltan fordulnak elő (megfigyelhető az is, hogy a tárgyszóláncban a földrajzi elem kétszer is előfordulhat): Europe, Central--Foreign economic relations--European Union countries--Congresses. Földrajzi tárgyszó, kiegészítve tematikus tárgyszóval, időtárgyszóval és tematikus aspektust jelző tárgyszóval: United States--History--Civil War, 1861–1865--Social aspects. A földrajzi kifejezés lehet szabványos tárgyszólánc első eleme is. Az alábbi táblázat a Hungary példáján keresztül érzékelteti a földrajzi tárgyszó szerinti tárgyi böngészés (subject browse) fontosságát. 20. Tárgyszavas böngészés – Hungary földrajzi tárgyszó alapján
„Hungary‖ (részlet a találati listából) #
találat
# [1] [2] [3] [ 12 ]
Hits 23 3 10 1
[ 14 ]
1
[ 15 ] [ 16 ]
1 6
[ 18 ] [ 23 ]
3 2
tárgyszavak (megjelenítésre kiválaszthatók ) Headings (Select to View Titles) Hungary Antiquities. [from old catalog] Hungary Antiquities Juvenile literature. Hungary Antiquities Periodicals. Hungary Antiquities, Roman Guidebooks. Hungary Appropriations and expenditures. Hungary Archaeology. Hungary Armed Forces. Hungary Armed Forces Biography. Hungary Armed Forces Medals, badges, decorations, etc.
a tárgyszó típusa Type of Heading LC subject headings LC subject headings LC subject headings LC subject headings LC subject headings LC subject headings LC subject headings LC subject headings LC subject headings
A fentiekben azt is láthatjuk, hogy milyen tárgyszókategóriák, milyen sorrendben jelennek meg egymás után (pl. tematikus, formai tárgyszavak) Tárgyszavas böngészés az online katalógusban Az alábbi találati lista a Kongresszusi könyvtár online katalógusából – az agricultural machinery példáján keresztül az indextételek jó áttekinthetőségét jelzik, a tematikus tárgyszavakhoz rendelt idő-, majd földrajzi és időtárgyszavak segítségével. A Kongresszusi Könyvtár online katalógusában (Library of Congress Online Catalog) a tárgyi böngészés (subject browse) segítségével az „agricultural machinery‖ tárgyszóra keresve, a következő találati lista jelenik meg. (ld. melléklet) 95
INFORMÁCIÓKERESŐ NYELVEK II.
23. kép
Tárgyszavas böngészés:Agricultural machinery and implements
Láthatjuk, hogy balra fölül itt is lehetőség van az adott tárgyszó tezaurusz-relációinak a megjelenítésére a more info-ikonra kattintva. A mezőgazdasági gépekre és berendezésekre (agricultural machinery and implements) vonatkozó böngészési találati listában a főtárgyszóhoz kapcsolódó időtárgyszavak, majd földrajzi és időtárgyszavak rendjében kényelmes rendszerezett áttekintésre van lehetőség. A találatok megjelenítése a bibliográfiai rekordok Az alábbiakban egy kulcsszavas keresés (Agricultural mechanization in Asia) eredményeképpen kapott találat teljes rekordját mutatjuk be. Figyeljük meg a rekord felépítését, a további kereshető keresőnyelvi szavakat (a tárgyszavakon kívül a Kongresszusi Könyvtár osztályozási rendszere – LC Classification –, illetve Dewey Tizedes Osztályozása szerinti jelzetek). A rekordot lásd a mellékletben.
INFORMÁCIÓKERESŐ NYELVEK II.
24. kép
Rekord információkereső nyelvi elemekkel
7.3.5 A tárgyszórendszer fejlesztése A rendszerfejlesztés nem áll(hat) meg Az LCSH igyekszik folyamatosan beépíteni a tudományos, technikai fejlődés eredményeképpen keletkezett új fogalmak tárgyszavait. Természetesen tárgyszónak számít már az „information society‖, „data mining‖ (adatbányászat), ugyanakkor pl. a szemantikus web fejlesztések fogalmainak leképezése terén még folyamatos a teendő. A LCSH-t maga a könyvtár tartja kézben, dolgozza ki az elveket, útmutatókat, szerkeszti és közreadja a jegyzéket. A Cataloging and Acquisitions honlapon szerteágazó kérdésekről lehet tájékozódni.42 Láthatók a tárgyszavak létrehozásának és alkalmazásának szabályai, melyeken az egyes kiadások nyugszanak, a tárgyszavazás új fejleményei, irányelveinek változásai. Az LCSH az egyetlen világszabványként elfogadott tárgyszórendszer, egyben a világ legátfogóbb tárgyszórendszere. Új, nyomtatott kiadásokra évente, legfeljebb kétévente kerül sor, 5-6 kötetben („big red book‖-nak, nagy vörös könyvnek becézik). Ez a tárgysza42
Library of Congress Cataloging and Acquisitions URL:http://www.loc.gov/aba/
97
INFORMÁCIÓKERESŐ NYELVEK II. vakat, az utalásokat, és a tárgyszavakkal kapcsolatos alosztásokat tartalmazza, példákkal illusztrálva. Classification Web A hozzáférés legkorszerűbb eszköze, a Classification Web globális elérést biztosíthat (megfelelő előfizetési díj ellenében) a könyvtárosoknak és más profi felhasználóknak a Kongresszusi Könyvtár folyamatosan felújított osztályozási és tárgyszórendszeréhez, tezaurusz típusú deszkriptorcikkek alatt.43 Ennek fejében számos naprakész, minőségi szolgáltatást vehetnek igénybe, pl. az LCC osztályozási rendszeréhez való teljes szöveges hozzáférés, az összes LCC tárgyszóhoz való hozzáférés tezaurusz-megjelenítésben, az LCC osztályozási jelzetek és a tárgyszavak közötti korrelációk, a fájlok napi aktualizálása, nagysebességű hozzáférés, hatékony kereső és navigációs eszközök használata stb. Együttműködési programok Elérhetők innen az authority rekordok44 a PCC közös katalogizálási program 45, és a különböző részprogramok weblapjai (BICO, CONSER, NACO, SACO). . A folyamatos tájékoztatás érdekében hetente közreadják a SACO együttműködési program honlapján46 az elfogadott tárgyszó-, és osztályozási jelzet-módosítási javaslatok listáját (pl. LCSH, LCC), melyeket az egyes rovatokban találhatjuk meg. A katalogizálási útmutatók részletes listája vehető igénybe, köztük a Subject Cataloging Manual: Subject Headings – a tárgyszavazás, az alosztások következetes és szabványos használatát segítő kalauz, mely a könyvtár gyakorlata alapján nyújt segítséget a feldolgozóknak, illetve a tájékoztató könyvtárosoknak a feltárásban, illetve a keresőstratégiák öszszeállításában, számos példával illusztrálva, segítve a könyvtárral közös katalogizálási programokba lépők, vagy a helyi, illetve regionális szinten feldolgozást végzők munkáját. A rendszerfejlesztés szervezési technikái Lehetőség van arra, hogy ne csak a feldolgozók, hanem a felhasználók, „külsők‖ is aktívan bekapcsolódjanak a fejlesztésekbe. A változások nemcsak bővítést jelentenek, de pontosítják is a tárgyszavak írásmódját, a feltüntetett kapcsolatokat, a permutációs lehetőségeket. Az alábbiakban a módosítási lehetőségekkel kapcsolatos néhány módszert mutatjuk be, tekintettel arra, hogy hazánkban is fejlődik már egy egységes tárgyszórendszer és tárgyszavazási gyakorlat. A tárgyszófejlesztés, -módosítás adminisztratív kezelése A SACO (Subject Authorities Cooperative Program) honlapján – a Proposal forms alatt találhatók a különféle tárgyszóajánlás, módosítás benyújtására szolgáló űrlapok. A tárgyszavak/osztályozási jelzetek rendszerbe való felvételével, módosításával kapcsolatban kidolgozott különféle strukturált űrlapok és útmutatók megkönnyítik, mederbe terelik a tárgyszó-, és osztályozási rendszerre tett fejlesztési javaslatokat 47 43
Library of Congress Classification Web URL: http://www.loc.gov/cds/classweb/ Library of Congress Authorities. URL: http://authorities.loc.gov/ 45 Library of Congress Program for Coperative Cataloging. URL: http://www.loc.gov/catdir/pcc/ 46 Subject Authorities Cooperative Program. URL: http://www.loc.gov/catdir/pcc/saco/saco.html 47 Subject/Classification Proposal Forms and Guidelines. URL: http://www.loc.gov/catdir/pcc/saco/proposal_forms.html 44
INFORMÁCIÓKERESŐ NYELVEK II. Példák a különféle űrlapokra: javaslat új tárgyszó felvételére weben keresztül, javaslat új tárgyszó felvételére e-mailen, útmutató új tárgyszavak javaslásához, kitöltendő tárgyszójavasló űrlapok mintái, általános javaslati űrlap, javaslat földrajzi tárgyszó felvételére, tárgyszó-változtatási útmutató, javaslattételi űrlap Library of Congress osztályozási jelzetre. 7.3.6 A tárgyszavazás fejlesztésének további nemzetközi példái A brit és a francia nemzeti könyvtár tárgyszavazási gyakorlata A Brit Nemzeti Könyvtár tárgyszavazási gyakorlata A Brit Nemzeti Könyvtár (British Library) már 1971-től használta a Kongresszusi Könyvtár tárgyszavait tárgyi indexelésre, de 1988-1994 között ez megszakadt, 1995-től viszont újra megjelentek az LCSH tárgyszavas indextételek a rekordok tárgyi leíró mezőiben. A Brit Nemzeti Könyvtár az LSCH második legnagyobb használója, az előző fejezetben említett programok aktív résztvevője. A francia tárgyszórendszer és szabályzat A RAMEAU általános francia tárgyszórendszert és szabályzatot a Francia Nemzeti Könyvtár (Bibliothèque nationale de France) 48 dolgozta ki és kívüle a felsőoktatási könyvtárakban és számos más nyilvános könyvtárban használják. A legnagyobb tárgyszórendszerek közé tartozik. A RAMEAU a répertoire d'authorité de matières encyclopédique unifié rövidítése, mely magyarul azt jelenti, hogy egységes általános tárgyszóadatok szabványos adatállománya. Tájékozódási lehetőség: (Paris: Bibliothèque Nationale. RAMEAU 49 weblapon. A katalógus használatát érdemes kipróbálni, pl. magyar vonatkozású szavakkal, Hongrie. Recherche simple – egyszerű keresés, recherche avancéé (haladó keresés), par mots (szavak szerint), dans les index (indexben, mutatóban). A német SWD/RSWK tárgyszórendszer és tárgyszókatalógus szabályzat Fejlődéstörténetük és összefüggéseik A német általános tárgyszókatalógus szabályzatot a Német Könyvtári Intézet (Deutsches Bibliotheksinstitut, DBI) dolgozta ki 1978–1984 között RSWK néven. Teljes neve: Regeln für den Schlagwortkatalog, azaz „a tárgyszókatalógus szabályai‖. A munkálatokba a Német Nemzeti Könyvtár (Deutsche Bibliothek) is bekapcsolódott. A németországi könyvtárak 1978. évi konferenciáján a Deutsche Bibliothek képviselői arra kötelezték magukat, hogy 1986-tól központi szolgáltatásaikban az RSWK alapján tárgyszavaznak. A Deutsche Bibliothek mellett a szabályzat alkalmazásába olyan nagy online rendszerek is bekapcsolódtak, mint a BIS, az URICA vagy a Data Libris. Németországban nincs olyan könyvtár, amely az RSWK-t figyelmen kívül hagyhatná, vagy amelynek tárgyszavazási gyakorlatára nem lenne hatással.
48 49
Bibliotheque nationale de France. URL: http://www.bnf.fr/fr/acc/x.accueil.html RAMEAU. URL: http://rameau.bnf.fr/index.htm
99
INFORMÁCIÓKERESŐ NYELVEK II. Az RSWK 1. kiadása 1986-ban, a 2. kiadása 1991-ben, a 3. átdolgozott és bővített kiadása pedig 1998-ban jelent meg. Ez a kiadás már az Interneten is hozzáférhető lett (RSWK. 3., überarbeitete und erweiterte Auflage, 1998). A szabályzatot példákkal illusztrált módszertani segédletként segített alkalmazni. Kiegészítésekre több alkalommal került sor 2000-ben, 2002-ben, 2005-ben, 2007-ben és 2009-ben. A legfrissebb változat érhető el az Interneten.50 Ennek átdolgozott és kibővített kiadása a 2009. áprilisi állapotot tükrözi.51 Ajánlott a forrás megtekintése! A német tárgyszó-adatbázis Schlagwortnormdatei (SWD) folyamatosan fejlesztve, minden érdekelt (együttműködő intézmény, használó) számára rendelkezésre álló komplett tárgyszórendszer. Szabályozott, terminológiai szempontból ellenőrzött rendszer. Az SWDben található tárgyszavak minden szakterületet és tárgyszókategóriát átfognak. Az SWD tárgyszó-adatbázis a tárgyszavak mellett az utalásokat, hivatkozásokat, valamint a tárgyszórelációkat tartalmazza. Mindezeket az RSWK-ban, illetve a „Praxisregeln zu den RSWK und der SWD‖ c. szabályzatokban lefektetett elvek szerint tartják karban. A tárgyszószabályozás és -rendszer fő ismérvei Az RSWK szabályrendszerének legfontosabb célkitűzése: a tárgyszavaknak „értelmes mondatszerű‖ tárgyszóláncba történő összekapcsolása. A dokumentum tartalmát leíró (több tárgyszót is magába foglaló) kifejezést, összetett tárgyszónak nevezik. Az összetételek tárgyszavai az LCSH-hez hasonlóan típusaiknak megfelelően tárgyszókategóriákba sorolhatók. Ennek az elvnek megfelelően az alábbi típusokat különböztetik meg: – − személyi, illetve testületi tárgyszó; − földrajzi, illetve népi (etnikai) tárgyszó; − szaktárgyszó; − időtárgyszó; − formai tárgyszó; Az RSWK tárgyszókategóriái feltűnő hasonlóságot mutatnak Ranganathan PMEST formulájával. Baloldalon található RSWK tárgyszókategóriák, illetve a jobb oldalon található Ranganathan-féle vetületek szinte hiánytalanul megfeleltethetők.
50
Regeln für den den Schlagwortkatalog : RSWK / hrsg. von der Arbeitsstelle für Standardisierung. Red.: Martin KUNZ. Arbeitsstelle für Standardisierung. Frankfurt am Main /Expertengruppe RSWK-SWD Leipzig [u.a] : Deutsche Nationalbibliothek, 2007. 480 p. URL: http://files.d-nb.de/pdf/rswk_gesamtausgabe.pdf 51 Regeln für den Schlagworkatalog RSWK. 3., überarbeitete und erweiterte Auflage auf dem Stand der 5. Ergänzungslieferuing April 2009. URL: http://files.d-nb.de/pdf/rswk_gesamtausgabe.pdf
INFORMÁCIÓKERESŐ NYELVEK II.
25. kép
Az RSWK tárgyszavak és a PMEST vetületek megfeleltetése
E típusok, elnevezésükkel megegyező tárgyszó kategóriákba tartoznak. Az összetétel szórendjét, a kategóriák definiált sorrendje határozza meg. Az összetétel első szava a főtárgyszó, minden további (az esetleges homonima értelmezőkkel együtt) altárgyszónak minősül. Fontos kikötés az is, hogy az összetétel maximálisan öt altárgyszót foglalhat magába. Nyilvánvaló, hogy a felső határt a kombinációk számának korlátozása céljából adták meg. Egy-egy tárgyszóláncot kategória-szabály szerint kell megszerkeszteni. A tematikus szabályozás területei Az alábbi melléklet az RSWK szerinti szabályozás egy szűk szeletét mutatja, a tematikus tárgyszavakét. (Ezek a szabályozás paragrafusszámaival a 2010.06.28-i állapot szerint a 143–155. lapon találhatók). Az egyes paragrafusok meghatározásokat és példákat tartalmaznak. A tematikus tárgyszavak szabályozásának területei az RSWK-ban (ld. melléklet)
101
INFORMÁCIÓKERESŐ NYELVEK II.
26. kép
Részlet az RSWK-ből (A tematikus tárgyszavak szabályozásának területei)
* (Megj.: Pleonazmus jelentése: szóhalmozás, szószaporítás, azonos jelentésű, és ezért felesleges szavak halmozása (pl. „grünes Gras‖ – „zöld fű‖). Az RSWK-ban a tematikus tárgyszavak mellett más típusú tárgyszavak (személyi, földrajzi, idő-, formai) is hasonló alapossággal, részletességgel szabályozottak.) A keresés gyakorlására a német nemzeti könyvtárban (Deutsche Nationalbibliothek) jó lehetőség nyílik.52
52
Deutsche Nationalbibliothek https://portal.d-nb.de/
INFORMÁCIÓKERESŐ NYELVEK II. A keresést segítő szavak − Einfache Suche: egyszerű keresés − Erweiterte Suche: kiegészített keresés − Browsen (DDC) Böngészés (Dewey Tizedes Osztályozás) A MACS Project A tárgyszavazás nemzetközi elterjedésében és fejlesztésében a főszerepet a Kongreszszusi Könyvtár tárgyszórendszere játssza. Emellett vannak más kezdeményezések is, pl. az Európai Unió nemzeti könyvtárai között. A MACS Project (Multilingual ACcess to Subjects) célja, hogy feltárja a többnyelvű tárgyi hozzáférés módjait annak érdekében, hogy elősegítse az európai nemzeti könyvtárak katalógusainak egy platformon történő keresését. A projektet az Európai Nemzeti Könyvtárak Konferenciája (Conference of European National Librarians, CENL) támogatja. [Internet címe: http://search.theeuropeanlibrary.org/portal/en/index.html ]
7.4
ÖSSZEFOGLALÁS
A 7. lecke fő részében a világszabványnak számító Library of Congress – Kongresszusi Könyvtár tárgyszórendszerét (LCSH), tárgyszavazási szabályait mutattuk be, az 1. fejezetben betekintést ad a tárgyszavazás több mint 110 éves fejlődéstörténetébe. Ezt követően a tárgyszórendszer fő ismérveit, formáját, tárgyszókategóriát ismerhette meg példák segítségével. Példákon keresztül sorra vettük a szótani, alaktani, jelentéstani szabályozásokat. Ezt követte az indexelési szabályok megismerése (4. fejezet), majd az elkészült indextételekre épülő keresési és böngészési lehetőségek számbavétele. A tárgyszórendszer mind nyelvi, mind logikai szempontból alaposan kidolgozott és karbantartott. A tezauruszra emlékeztet a tárgyszavak közötti logikai kapcsolatok jelölési módja. Sajátos az indexelési módszere, mely a főtárgyszavak mellett al-, és melléktárgyszavakat használ, és ezzel a böngészéshez jól áttekinthető listákat szolgáltat. Fontos tanulságokkal szolgálnak azok a módszerek, szervezési eljárások, melyek a tárgyszórendszer folyamatos fejlesztésére irányulnak. A fejlesztésnek, az azzal összefüggő együttműködésnek globálisak a keretei. Érdemes megismerni, és megszívlelni azokat a hatékony adminisztratív eljárásokat, amelyek a tárgyszórendszer folyamatos fejlesztését segítik. Más nemzetközi alkalmazású tárgyszórendszerek közül a francia, illetve a német tárgyszórendszert ismerhette meg, az utóbbiról részletes információkat szerezve a tárgyszórendszer és tárgyszavazás szabályozásáról. Végül a MACS projekt keretében az Európai Uniós összehangolt fejlesztésre hívtuk fel a figyelmet.
7.5
ÖNELLENŐRZŐ KÉRDÉSEK
1.
Fejtse ki a Kongresszusi Könyvtár tárgyszórendszerének alapvető ismérveit!
2.
Tekintse át a létrehozásának, fejlődésének fő állomásait!
3.
Foglalja össze a nemzetközi elterjedésének fő jellemzőit!
4.
Mutassa be a tárgyszórendszer összetevőit! 103
INFORMÁCIÓKERESŐ NYELVEK II. 5.
Fejtse ki az alaktani és a logikai szabályozás jellemzőit!
6.
Mutassa be az LCSH szerinti indexelés alapelveit, példán keresztül!
7.
Tekintse át az LCSH fejlesztésének alapvető eszközeit és módszereit!
8.
Hogyan látja a Kongresszusi Könyvtár szerepét a globális tudásreprezentációban?
9.
Fejtse ki a francia tárgyszórendszer alapvető ismérveit!
10. Tekintse át a német tárgyszórendszer és német tárgyszavazási szabályzat fő
jellemzőit!
INFORMÁCIÓKERESŐ NYELVEK II.
8. MAGYAR TÁRGYSZÓRENDSZEREK 8.1
CÉLKITŰZÉS
A lecke feldolgozásával legyen képes − a magyar nyelvű általános tárgyszórendszerek problémakörének ismertetésére, − a fejlesztési analógiaként számba vehető külföldi tárgyszórendszerek áttekintésére, − az Új Könyvek tárgyszójegyzék szerinti alaktani, indexelési szabályok bemutatására, − az Új Könyvek tárgyszójegyzék szerepének, alkalmazásának értékelésére, − a dinamikusan fejlődő együttműködési formák (közös katalógusok stb.) fejlesztési elveinek, gyakorlatának bemutatására, − a Debreceni Egyetem Egyetemi és Nemzeti Könyvtára (DEENK) által működtetett tárgyszó-adatbázisa céljának, szerepének kifejtésére, − a különböző tárgyszavazási megoldások elemzésére, értékelésére, − a legújabb fejlesztések és alkalmazások kifejtésére.
8.2
TARTALOM
1. Az Új Könyvek tárgyszójegyzék kifejlődése, fő ismérvei – Fejlődéstörténete – A tárgyszószabályozás területei 2. A tárgyszókategóriák 3. A indexelés szabályai 4. Az ÚK tárgyszójegyzék és tárgyszavazás értékelése 5. A Kongresszusi Könyvtár-DEENK tárgyszórendszer fő ismérvei – A magyar változat fő ismérvei – A DEENK tárgyszó-adatbázis működtetési tapasztalatai 6. További meghatározó fejlesztések – Köztaurusz – MÁTRIKSZ program 7. A megismert tárgyszórendszerek értékelési szempontjai
8.3
A TANANYAG KIFEJTÉSE
8.3.1 Az Új Könyvek tárgyszójegyzék kifejlődése, fő ismérvei Fejlődéstörténete Magyarországon az 1950-es években már működött tárgyszókatalógus, pl. az Egyetemi Könyvtárban (ELTE), a debreceni Kollégium Nagykönyvtárában, de szélesebb körű elterjedésére csak az 1960-as években került sor az Új Könyvek tárgyszórendszer kidolgozásá105
INFORMÁCIÓKERESŐ NYELVEK II. val, folyamatos fejlesztésével. Az Új Könyvek állománygyarapítási tanácsadó folyóirat 1964 óta tájékoztat a magyar nyelvű könyvekről (kisebb részben térképekről, hazai kiadású idegen nyelvű könyvekről, határon túli magyar nyelvű irodalomról, CD-ROM-okról). A Könyvtárellátó, mai népszerű nevén KELLO által megjelentetett tanácsadó folyóiratban a szerkesztési munkálatokat hagyományosan az OSZK Könyvtártudományi és Módszertani Központ (ma Könyvtári Intézet) Gyűjteményépítési Információs Osztálya látta el. A tárgyszavak az állománygyarapítási folyóiratban, illetve a bibliográfiai tételek részeként, illetve a katalóguscédulákon is megjelentek. A cél az volt, hogy előkészítsék és segítsék a könyvtárakban a következetes tárgyszavazást, az adekvát és gazdaságos visszakeresést, a színvonalas katalógusépítést, ennek eszközének szánták egy kiforrott, szabványosnak tekinthető magyar tárgyszójegyzék megteremtését. Az Új Könyvek (ÚK)-tárgyszójegyzék szerinti tárgyszavazási munkálatok eredményei technológiailag három szakaszt fognak át: (1) a nyomtatva megjelenő állománygyarapítási tanácsadóban, illetve katalóguscédulákon megjelenő tárgyszavak, (2) egy hétéves időszak anyagának CD-ROM-on való megjelentetése. (3) A KELLO adatbázisában elektronikus formában elérhető tételek útján. A fejlesztés fő állomásai: (1) Az 1965-1969. anyagát feldolgozó kumulált 5 éves tárgyszómutató megjelentetése – a további tárgyszavazási munka alapjaként szolgált. (2) Az Új Könyvek 1965-1976 közötti évfolyamai teljes tárgyszóanyagának és mutatójának (mely, kidolgozottsága miatt egy tárgyszórendszer alapjának felel meg) kiadása 1980-ban, 53 (3) Az Új Könyvek I. félév (1-16) számaihoz kumuláló tárgyszómutató megjelentetése 1986-ban kísérleti jelleggel, majd negyedéves tárgyszómutatók kiadása a tárgyszókatalógust szerkesztő könyvtárak segítése érdekében. (4) A Gyűjteményépítési Információs Osztály folyamatos szerkesztői munkájával számítógépes adatbázist hoztak létre az Új Könyvekben ismertetett művekről. Az ARCANUM cég gondozásában 2002-ben jelent meg az a CD-ROM, mely az Új Könyvek 1994-2000 között kéthetenként megjelent számaiban ismertetett művek teljes anyagát dolgozta fel adatbázis formájában. (182 folyóiratszám, összesen 37833 tétel). A keresési lehetőségek széles körét nyújtotta (szerzők, címek, sorozati címek, megjelenési adatok (pl. egy kiadó műve), témakörök, tárgyszavak, az Új Könyvekben használt ajánló jelzetek (pl. egyegy könyvtártípusba tartozó könyvekre, kézikönyvekre stb.). Ehhez kapcsolódott a kulcsszavas keresés lehetősége a könyvismertetésekben szereplő minden szó szerint. (Új Könyvek 1994–2000, 200254). (5) Az Új Könyvek állománygyarapítási tanácsadóban szereplő könyvek adatai a KELLO adatbázisban kereshetők, tárgyszavak szerint is. A tárgyszavazás fontos jellemzője maradt a prekoordináció, a tárgyszavak előzetes egymáshoz rendelése. A könyvtárak a beszerzési döntéseik során építenek a szurrogátum részét képező annotációkra is. Az ÚKban szereplő tárgyszavakat alapul veszik, de általában kiegészítik saját tematikus igényeik és gyakorlati módszereik szerint.
53 54
Tárgyszójegyzék és tárgyszómutató az Új Könyvek 1965-1976. évfolyamaihoz. 1980. Új Könyvek 1994–2000. CD-ROM. Bp.: ARCANUM, 2002.
INFORMÁCIÓKERESŐ NYELVEK II. A tárgyszószabályozás területei A tárgyszójegyzéke fő jellemzői, részei Az ÚK tárgyszójegyzéke egyszerre tárgyszójegyzék, tárgyszavazási és katalógusépítési eszköz. Nem lépett fel a teljesség igényével, nem törekszik a fogalmak tartalmi teljességére, mert ez elvileg lehetetlen, hiszen állandóan új és új fogalmak merülnek fel. Fejlesztői úgy vélték, hogy ezeket a tárgyszavazóknak, katalógusépítőknek kell beépíteniük a meglevő rendszereik keretei közé. Mint a tárgyszójegyzék bevezetőjében jelezték: „Természetesen jelenlegi formájában ez a rendszer nem lehet teljes, de szerveződési elvei olyan világosak, hogy analógiás alapon már könnyen továbbfejleszthető.‖55 Az ÚK tárgyszójegyzék gyanánt tartalmazza a tárgyszavakat, az utalásokat, a hivatkozásokat (minden esetben következetesen utalva az inverziókra, a tárgyszóként nem használt alosztásokra, a szinonimákra, kváziszinonimákra). A tárgyszójegyzék kiadásának (1980-ban) fontos elve volt, hogy törekedett a tárgyszavak strukturálására, a fogalmak közötti hierarchikus kapcsolatok (egész–rész, nem–faj összefüggések), rokonértelműségi összefüggések áttekinthető ábrázolására. Fontos lépésnek szánták a szerves tárgyszórendszer kialakításának folyamatában. A szabályozás területei: alaktan, szótan, jelentéstan Alaktani és szótani szabályozás Az Új Könyvek tárgyszórendszer esetében is főnév szerepelhet egyedüli szófajként, az egyes szám–többes szám használata szabályozott, a szóösszetételek, összetett szavak megtartása, vagy lebontása szintén szabályozott. Cél olyan tárgyszavak megválasztása, melyekkel a lehető legpontosabban és legtömörebben fejezhető ki a dokumentumok információtartalma. Az információtartalmak különbségeit figyelembe véve mindez csak igen különböző tárgyszavak megalkotásával lehetséges. Egyaránt szerepelnek a tárgyszójegyzékben egyszerű főnevek (Acél), illetve összetett főnevek (pl. Acélgyártás).
55
Tárgyszójegyzék és tárgyszómutató... i.m. VIII. p.
107
INFORMÁCIÓKERESŐ NYELVEK II. 21. A tárgyszavak alakja az UK tárgyszórendszerben:
Tárgyszóstruktúrák Egyszerű tárgyszó (egyetlen szó) Két vagy több szóból összetett szó Több szóból álló kifejezés (1) Alosztályozott formájú kifejezések Egy összetett tárgyszó tagjainak tagolása gondolatjellel Alosztályozás — gondolatjellel Alosztályozás – inverzióval – pl. jelzős kifejezés, amikor a jelző a fő fogalomnak csak alosztása Idegen nevek – vesszővel tagolva Az „és‖ kötőszóval két egyenrangú, gyakran öszsze-kapcsolható tárgy kapcsolatának kifejezése
Példák Arany Állattenyésztés Francia irodalom Hőátadás – Motorok, belső-égésű Orosz irodalom – Költészet Kémia, szerves Horváth, Ödön von Állam és egyház
(2) Ezek jelentős része Jelzős kifejezés természetes nyelvi formában, ha a jelző a fő értelemhordozó (további példa: Civilizációs betegségek) Az egyes szám és többes szám kérdése A tárgyszórendszer szempontjából fontos az egységes gyakorlat kialakítása az egyes szám, illetve a többes szám használata terén: 22. Az egyes szám, többes szám használata
Egyes/többes szám Egyes szám
Alkalmazása elvont fogalmak konkrét egyedi fogalmak
Többes szám
élőlények és tárgyak csoportjai
Példák Barátság Vas, Arany Bibliográfia, nemzeti Pedagógusok Bibliográfiák
Jelentéstani szabályozás A jelentéstani szabályozás alapvető szerepet tölt be az ÚK tárgyszójegyzékében. Nézzük mindenekelőtt az azonos jelentésű, de más alakú szavakat. Az egyértelműség érdekében egyedi, illetve általános utalókat használnak. Az utaló egy elvetett kifejezésről (szinonimáról) vezet el a megfelelő tárgyszóhoz, pl. Lélektan ld. Pszichológia.
INFORMÁCIÓKERESŐ NYELVEK II. 23. A egyedi, illetve általános utaló használata
Utaló Egyedi utaló Általános utaló
Jelentése Mindig tárgyszóként nem használt, elvetett kifejezésről vezet el egy tárgyszóhoz Tárgyszóként nem használt, elvetett kifejezésről a tárgy-szavak egy csoportjához vezet el
Példa Gazdasági reform ld. Gazdaságirányítás Aforizmák ld. az egyes nyelvek irodalma és Világirodalom alatt
A visszautaló használatát is bevezették – ez megmutatja, hogy az illető tárgyszóra honnan történt utalás. A visszautaló jele x (mely a ld. utaló kiegészítő párja. Példa: Asztalitenisz x Ping-pong Tárgyszavak közti kapcsolatok – a hivatkozások A tárgyszavak közötti kapcsolatok jelölése szintén alapvetően fontos szerepet kap az ÚK tárgyszójegyzékben. Az ennek kifejezését szolgáló hivatkozás mindig tárgyszóról vezet el valamilyen, közelebbről meg nem határozható, de releváns tárgyszócsoporthoz. 24. A hivatkozások típusai az ÚK tárgyszójegyzékben
Hivatkozás típusa Gyűjtő hivatkozás Általános hivatkozás
Meghatározása
Példák
A hivatkozott csoportot teljesség igényével felsorolja A hivatkozás nem a teljesség igényével, hanem csak általánosságban történik
Magyar Irodalom – Történet ld. még Abafi Lajos, Aczél Tamás Fizika – Történet ld. még az egyes fizikusok neve alatt is
A visszahivatkozás a visszajelző azon típusa, mely technikai jelként, a katalógusszerkesztés segédleteként azt mutatja meg, hogy az illető tárgyszóra honnan történt hivatkozás. Az egyirányú ld. még: hivatkozásnak ez a visszahivatkozás az ellenpárja, melynek jele: xx, például: Építészet xx Művészet A hivatkozásokhoz (különösen az általános hivatkozásokhoz) gyakran kapcsolódnak magyarázatok. A tárgyszavak közötti logikai összefüggések, a tárgyszótétel A tárgyszavak közötti logikai kapcsolatokat tárgyszótételben tüntetik fel. A rendszerben a fogalmak, illetve tárgyszavak közötti hierarchikus (nem–faj, egész–rész), illetve rokonértelműségi kapcsolatokat fejezik ki. Hierarchikus összefüggés jelölése nyíllal történik, mely a nem fogalomról vezet a faj fogalmak felé, pl. Gépjárművek → Gépkocsi →Motorkerékpár →Traktor stb.
109
INFORMÁCIÓKERESŐ NYELVEK II. Rokonértelmű összefüggésen, a hierarchikuson kívüli egyéb összefüggéseket (pl. eszköz, rendeltetés, művelet) értik és jelölik. A jelölés kettős, oda-vissza mutató nyíllal történik: Gépkocsi ↔ Gépkocsijavítás ↔ Gépkocsivezetés A tárgyszótétel felépítése Egy-egy tárgyszón belüli a szükséges elemek szigorúan meghatározott rendben helyezkednek el, sorrendjük: 25. A tárgyszótétel felépítése
Az elem megnevezése 1. Tárgyszó 2. Visszautalás(ok) 3. Visszahivatkozás(ok) 4.a hierarchikus összefüggések
Jele
Az összefüggés megnevezése
x xx xx
4.b hierarchikus összefüg-gések
→
5. Rokonértelmű összefüggések
↔
A tárgyszóra vonatkozó utalók A tárgyszóra vonatkozó hivatkozások A tárgyszóval kapcsolatos magasabb reláció(k) A tárgyszóval kapcsolatos alacsonyabb szintű reláció(k) Nem-hierarchikus, hanem egyéb rokonértelműségi összefüggések Nem a teljesség igényével történő hivatkozások
6. Általános hivatkozás
ld. még
8.3.2 A tárgyszókategóriák Szaktárgyszavak (tematikus tárgyszavak) Specifikus tárgyat jelölő tárgyszavak Pl. Gépkocsi, Munkaerő-gazdálkodás, Magyarország – Történelem, Gépjárművek, Iskolák Az „etnikai jelzők‖ (hangsúlyozottan) fontos szerepet töltenek be a nyelvi, irodalmi, néprajzi, tehát az etnikumhoz és nem az országhatárokhoz kötött fogalmak ábrázolásában Pl. Magyar nyelv, Francia irodalom. Személyi/intézményi tárgyszavak Mind a konkrét személyek, mind csoportjaik szerepelhetnek főtárgyazóként Pl. Apáczai Csere János, Pedagógusok A specifikust kívánja megragadni. Ha pl. egy konkrét festőművészről van szó, akkor az ő nevét adja meg, és nem osztályozza festészet alá. Pl. Csontváry-Kosztka Tivadar, és nem: Festészet- Magyarország 19-20. sz. A testületi nevek – eredeti formában szerepelnek Pl. Goszudarsztvennüj Ruszszkij Muzej – Szankt-Peterburg, utalással a magyar névformáról. Földrajzi tárgyszavak Földrajzi tárgyszavakat használ az államhoz, földrajzi egységekhez kapcsolódó fogalmak jelölésére Pl. Franciaország – Művészet.
INFORMÁCIÓKERESŐ NYELVEK II. Az esetek többségében a földrajzi fogalmak kereshető ismérveket jelölnek, pl. Balaton – Környezetvédelem, Magyarország – Történelem, Spanyolország – Festészet, Bükk – Térképek. Az esetek egy részében azonban a földrajzi nevek nem közvetlen elérési pontok, hanem más tárgyszavakhoz kapcsolódnak, (ide tartozik azoknak az eseteknek nagy része, amikor Magyarországról van szó) Pl. Belpolitika – Magyarország. (Mint láthattuk, a Magyarország – Történelem kivételt jelent ez alól a szabály alól.) A földrajzi tárgyszavak esetében folyamatosan követik a változásokat. A rendszerváltás után a volt Szovjetunióban egy sor város kapta vissza régi, vagy régies nevét, pl. Leningrád-ból Szankt Peterburg (vagy más rendszerekben Sankt Peterburg) lett. Időtárgyszavak Az ÚK szerint kiegészítő szerepet töltenek be Pl. Franciaország – Történelem 1789. Szintén csak alosztás szerepet tölt be a „Történet‖ tárgyszó Pl. Matematika – Történet. Kiegészítő szerepet töltenek be a nagy történeti korszakok, mint Ókor, Középkor stb. Pl. Ókor – Történelem ld.: Világtörténelem – Ókor. Ugyancsak kiegészítő szerepet töltenek be az egyes országok történelme stb. alatt Pl. Görögország – Történelem – Ókor. Formai tárgyszavak Általában csak kiegészítő szerepet töltenek be. Egyesek egyes számban szerepelnek, pl. Fényképgyűjtemény, Példatár. A döntő többségük azonban többes számban szerepel, pl. Antológiák, Atlaszok, Bibliográfiák, Címtárak, Évkönyvek Katalógusok, Levelek, Szabványok, Visszaemlékezések stb. 8.3.3 Az indexelés szabályai A tárgyszavak az esetek többségében tárgyszóláncokba, indextételekbe szerveződnek. Mind a személyi, tematikus, földrajzi tárgyszavak lehetnek főtárgyszavak. Az ezekkel kapcsolatos példákra a tárgyszókategóriák ismertetésénél is kitértünk. Az Új Könyvek tárgyszavazási gyakorlatában a tárgyszóláncban fontos szerep jut az alosztályozásnak, ami történhet időtárgyszóval, formai, illetve tematikus tárgyszavakkal (betűrendben), illetve földrajzi tárgyszavakkal (betűrendben). A szabályokat a Tárgyszójegyzék és tárgyszómutató az Új Könyvek 1965-1976. évfolyamaihoz c. kiadvány bevezetés része mutatja be. Az indextétel egyes elemeit a „-‖ ,, [gondolatjel] tagolja. Ez csak az időtárgyszavak előtt nem jelenik meg.
111
INFORMÁCIÓKERESŐ NYELVEK II. 26. Tárgyszavazási példák az ÚK tárgyszójegyzék alapján
A dokumentum tárgya Indextétel – tárgyszólánc(ok) Dél-amerikai indiánok Amerika – Dél-Amerika – Indiánok és Indiánok – Amerika – Dél-Amerika Dél-Amerika ld.: Amerika – Dél Amerika A magyar nyelv tanítása Magyar nyelv – Tanítás – Iskola, általános 8. o. az általános iskola 8. osztályában Családi életre nevelés Nevelés, családi életre Családi életre nevelés ld. Nevelés, családi életre Rákóczi Ferenc élete és Rákóczi Ferenc, II. erdélyi fejedelem és Magyarország – kora Történelem 1670–1740-es évek Művészettörténeti biblio- Művészet – Történet – Bibliográfiák gráfiák Bibliográfia a szakbibliográfiákat ld.: az illető tárgy vagy személy, dokumentumtípus neve alatt A Magyar Nemzeti BibBibliográfia, nemzeti – Magyarország 1473–1600 liográfia 1473–1600 Nemzeti bibliográfia ld: Bibliográfia, nemzeti Olasz széphistóriák anto- Olasz irodalom – Széphistóriák – Antológiák lógiája – Széphistóriák ld.: az egyes nyelvek irodalma alatt … Antológiák ld.: az egyes nyelvek irodalma alatt Szabadkától Újvidékig. Vajdaság – Irodalmi élet 1970-es évek Irodalmi élet az 1970-es Irodalmi élet – Vajdaság 1970-es évek években Máltai útikalauz Málta – Útleírások Útleírások ld.: az egyes földrészek, földrajzi tájak, országok stb. neve alatt Folyóiratok a közművelő- Periodika – Könyvtár, közművelődési dési könyvtárakban és Könyvtár, közművelődési – Periodika Közművelődési könyvtár ld.: Könyvtár, közművelődési Megj.: az utalásokat dőlten jelöltük. 8.3.4 Az UK tárgyszójegyzék és tárgyszavazás étékelése Az ÚK tárgyszójegyzéke átfogó általános célú, a tudományok és gyakorlat egészét átfogó tárgyszórendszer, mely az alapvető megoldásokat kínálja az állománygyarapításhoz, a tárgyi feldolgozáshoz. A tárgyszavak a helyi körülményeknek megfelelően alkalmazhatók. − Az ÚK tárgyszórendszer és az alapján végzett tárgyszavazási gyakorlat biztatóan indult, a jegyzék és mutató kiadása 1980-ban jelentős lépés volt, utána mutatók kiadása is éveken át. − A rendszerben szellemi teljesítményként több tízezer könyv és más dokumentum feltárási gyakorlata, tapasztalata van.
INFORMÁCIÓKERESŐ NYELVEK II. − − − −
−
Ugyanakkor a tárgyszórendszert viszonylag kevés könyvtárban alkalmazták egyaz-egyben (főleg néhány városi könyvtárban). Szabályrendszerét, tárgyszavazási eszközeit nyomtatott formában, részben fejtette ki, annak naprakész online követhetősége már nem áll rendelkezésre. A szókincse közelebb került a mindennapi szóhasználathoz, de a központi, mintát adó tárgyszavazás a generalizálás szintjén maradt. Jelentős szerepe volt a tárgyszavazás elméletének és gyakorlatának magyarországi meghonosításában, fontos műhelyként segítette a könyvtárakban folyó tárgyszavazást, ezért jogos a vélekedés: „sokan vagyunk, akik az ÚK köpönyegéből bújtunk ki‖. A könyvtárak az állománygyarapodás, és a feltárás során is építettek a tárgyszavakra, bár az volt a jellemző, hogy azokat mérlegelve, nem egy-az-egyben vették át, hanem helyi igényeik szerinti tárgyszavakra váltották, legalábbis részben.
8.3.5 A Kongresszusi Könyvtár-DEENK tárgyszórendszer fő ismérvei A magyar változat fő ismérvei A természetes nyelven alapuló keresőnyelvek adott nyelvekhez kötődnek, vonatkozik ez a tárgyszórendszerekre is. Ugyanakkor a Kongresszusi Könyvtár világméretű hatása, kisugárzása oda vezetett, hogy számos országban, így hazánkban is kétnyelvű feltárás történik: az LCSH angol nyelvű tárgyszavai mellett, azok tükörfordításaival együtt. Így van ez a Debreceni Egyetem Nemzeti és Egyetemi Könyvtára (DEENK) esetében is56, mely mintaszerűen oldja meg a különböző keresőnyelveket igénybevevő, differenciált feltárás feladatát. Központi katalógusa57: a világ legnagyobb könyvtárának (Library of Congress, Washington) nemzetközileg is széles körben használatos osztályozási rendszerének terminusait magyarítja, és felelteti meg az ETO jelzetekkel is. A tematikai keresőrendszer adatbázisa a magyar és angol kifejezésekkel valamint az ETO jelzetekkel külön-külön is böngészhető. A mellékelt tételben (2005. évi mikrocenzus) megfigyelhetők a prekoordinált tárgyszavazási megoldások: − Népesség – Magyarország – statisztika − Gyermekek – Magyarország − Háztartások – Magyarország – statisztika − Foglalkoztatás – Magyarország statisztika A négy tárgyszólánc mellé, két ETO jelzet járul.
56 57
Debreceni Egyetem Nemzeti és Egyetemi Könyvtár. URL: http://www.lib.unideb.hu Debreceni Egyetem Nemzeti és Egyetemi Könyvtár Központi katalógus. URL: http://webpac.lib.unideb.hu/WebPac/CorvinaWeb illetve http://webpac.lib.unideb.hu/WebPac/, Tárgyszavazási és böngészési példák
113
INFORMÁCIÓKERESŐ NYELVEK II.
27. kép
Tárgyszavazási példa: 2005. évi mikrocenzus
A mellékelt tételben Buckland könyve (Redesigning library services: a manfiesto) magyar fordításának tárgyszavas indextételében jól megfigyelhető a specifikus tárgyszavazás igénye, az átgondolt prekoordinált megoldások, melyek mindegyike a megadott összetett indexkifejezések segítségével további keresés alapja lehet, az alábbiak szerint: Könyvtártudomány technológiai újítások menedzsment Információtechnológia menedzsment Könyvtárak automatizálás menedzsment Könyvtárvezetés Könyvtárak és olvasók Szervezeti változás (Megj.: Az ETO-jelzetek alkalmazása ehhez képest nem elég specifikus.)
Szerző:
Buckland, Michael Keeble
Cím:
Redesigning library services: a manifesto (magyar) A könyvtári szolgáltatások újratervezése / Michael Buckland ; [ford. Murányi Péter és Pálvölgyi Mihály] ; [közread. az] Országos Széchényi Könyvtár
Megjelenés:
Budapest : Országos Széchényi Könyvtár, 1998
Terjedelem:
102 p. ; 24 cm
Megjegyzések:
A függelékben: Buckland, Michael: What will collection developers do? – In: Information Technology and Libraries. – Vol. 14 no. 3 (Sept. 1995), p. 155–159. Bibliogr.: p. 87-88 és a fejezetek végén.
ETO jelzet:
025:681.3 681.3:025
ISBN:
963 200 385 3
Tárgyszavak:
Könyvtártudomány technológiai újítások menedzsment Információtechnológia menedzsment Könyvtárak automatizálás menedzsment Könyvtárvezetés Könyvtárak és olvasók Szervezeti változás Library science Technological innovations Management. Information technology Management. Libraries Automation
INFORMÁCIÓKERESŐ NYELVEK II. Management. Library administration. Libraries and readers. Organizational change. Egyéb nevek:
Murányi Péter Pálvölgyi Mihály (1947–) Országos Széchényi Könyvtár (Budapest)
openURL:
Corvina OpenURL Resolver v0.001 DEENK resolver
Boritó: Kosárban: 28. kép
Tárgyszóindextétel Buckland könyvének fordításáról a DEENK katalógusában
Böngészési példa A Kongresszusi Könyvtár tárgyszavai szerinti böngészésnek Debrecenben is megmutatkoznak az előnyei. A Népességre vonatkozó böngészés mellékelt példája mutatja, hogy jól áttekinthető, finomkeresést biztosít. A főtárgyszói szerepet játszó Népesség tárgyról a földrajzi alosztások szerinti bontással jó áttekintést kapunk. Ld. Melléklet : Böngészés a Népesség tárgyszó alapján Találatok Tárgyszó
Megjelenít
23
[lcsh//hun] SEE ALSO Népesség
23
[lcsh//hun] Népesség
37
[lcsh//hun] SEE ALSO Demográfia
1
[lcsh//hun] Népesség--Ausztria--19. századmutat
1
[lcsh//hun] Népesség az irodalomban
1
[lcsh//hun] Népesség egészségügyi szempontok-statisztikai módszerek mutat
1
[lcsh//hun] Népesség--Egyesült Államok mutat
2
[lcsh//hun] Népesség--Erdély (Románia)-statisztika--20. század
3
[lcsh//hun] Népesség--Európa
1
[lcsh//hun] Népesség--Európa, Kelet--statisztika
29. kép
mutat
Böngészés a Népesség tárgyszó alatt a DEENK-ben
115
INFORMÁCIÓKERESŐ NYELVEK II. A DEENK tárgyszó-adatbázis működtetési tapasztalatai 58 A Corvina integrált rendszert használó könyvtárak VOCAL rendszere 1997 óta működik. Az ODR (Az Országos Dokumentumellátó Rendszer lelőhely-adatbázisa, mely a VOCAL könyvtárak és a Könyvtárellátó Kht.. együttműködésével jött létre azzal a céllal, hogy a könyvtárközi kölcsönzések közvetlen, célzott irányítását segítse. A rendszerben való kereséshez nagymértékben hozzájárult a DEENK tárgyszóadatbázisa59 – az együttműködő könyvtárak rendszerében a szokásos online katalógus nyújtotta tárgyi keresésekhez képest két fontos szerepre vállalkozott: (1) lehetőséget nyújtani egy általános tárgyszórendszer fogalmi hierarchiája mentén történő keresésre és (2) biztosítani több tárgyszórendszer egymás mellett élését egy bibliográfiai adatbázison belül. A VOCAL rendszeren belül az alkalmazott tárgyszórendszerek folyamatos karbantartásában fontos szerepet kapott a tárgyszó-adatbázis, mely a DEENK-ben épített, a Library of Congress tárgyszórendszerének magyar fordításán alapuló szókészletet, az eredeti Library of Congress tárgyszavakat, a Szegedi Egyetem Központi Könyvtárában épített szintén általános tárgyszókészletet, illetve az angol nyelvű MeSH (Medical Subject Headings) orvosi tárgyszórendszert tartalmazza. A tárgyszó-adatbázis működtetésében szerzett tapasztalatok jól szolgálják a magyarországi tárgyszavazás fejlődését. 8.3.6 További meghatározó fejlesztések Fontos szót ejteni az Általános Tárgyszó Jegyzék (ÁTJ) tervezetéről, az OSZK-tezaurusz/Köztauruszról, valamint a MÁTRIKSZ program megjelenéséről. (BÁNKI, 2001)60 mely az országos tárgyi információkereső szolgáltatás kialakításával kapcsolatos. Az Általános Tárgyszó Jegyzék tervezete Az Általános Tárgyszó Jegyzék (ÁTJ) tervezetének elkészítése fontos elméleti-módszertani állomás volt. A benne megfogalmazott tárgyszórendszer-fejlesztési elvek ma is érvényesek:61: − a meglevő hazai eredményekre és kezdeményezésekre, valamint a külföldi általános tárgyszójegyzékekre való építés, − a feldolgozott adatoknak a magyar ―Besorolási adatállomány - tárgyszavak‖ (subject authority) állományba való integrálása − a besorolási adatállomány központi karbantartása, bibliográfiai adatcsere elősegítése, − a tételek megfeleltetése legalább az angol nyelvű subject authority-kkal.
58
Corvina Vocal kereső. URL: http://odr.lib.klte.hu/ Vocal tárgyszó-adatbázis. URL: http://odr.lib.unideb.hu/corvina/odr/term_search 60 BÁNKI Zsolt: MÁTRIKSZ – Magyar Átfogó Tárgyi Információkereső-nyelvi Szótár : Új fejezet a tartalmi visszakeresésben = Könyvtári Figyelő, 47. évf. 2001. 4. sz. 672-678. URL: http://epa.oszk.hu/00100/00143/00040/banki.html 61 HORVÁTH Tibor: Az általános tárgyszójegyzék munkálatairól = Könyvtári Figyelő, 2. (38.) évf. 1992. 610617.p 59
INFORMÁCIÓKERESŐ NYELVEK II. Az ÁTJ tervezetében külön szerepel a lexikai egységek mondatszerű láncba szervezésének elve a természetes nyelv mondatainak analógiájára. (a PRECIS indexelés analógiájaként). Sajnos, a tárgyszójegyzék a tervezett keretben és módon nem valósult meg. Ennek hiányában az egyes könyvtárak maguk kezdték el kialakítani sajátos helyi tárgyszavazási gyakorlatukat, aminek helyben lehettek előnyei, de az országos együttműködés szempontjából csaknem kaotikus állapotokat idézett elő az 1990-es évek második felében. Az évtized végétől viszont láthatóvá váltak az újabb fejlesztések a jól átgondolt, egységes feltárás irányban. Ezek között kétségkívül a legnagyobb horderejű az OSZK-tezaurusz kifejlesztése és megjelentetése volt, mely iránt az átfogó gyűjteményű nyilvános könyvtárak is érdeklődést tanúsítottak. Erre adott válaszként jött létre a tezaurusz Köztaurusz változata. Nagy jelentőségű volt, hogy az egyes integrált könyvtári rendszereket használó könyvtárak számos közös katalógust, vagy közös keresési felületet hoztak létre, amely az adatexport, -import révén az egységesebb tárgyszavazás irányában hatott. (Ld. bővebben Információkereső nyelvek 3. félévében, a közös katalógusok részben.) A harmadik fontos fejlemény a MÁTRIKSZ program megjelenése volt, mely a magyarországi tárgyszórendszerek együttműködő rendszerének kidolgozására vállalkozott. OSZK-tezaurusz/Köztaurusz Az OSZK-ban egészen az ezredfordulóig nem használtak tárgyszórendszert a könyvek osztályozására. A tárgyszavazás az MNB Időszaki Kiadványok Repertóriumában (MNB IKR) ugyan megjelent az 1980-as években és szépen kibontakozott az IKER adatbázisban (mely később beolvadt a HUMANUS adatbázisrendszerbe). A Könyvek Bibliográfiájában (MNK KB), illetve az online katalógusban azonban csak a 2000-es évek elején jelentek meg a tárgyszavak, az OSZK Tezaurusz elkészülte és bevezetése után. Az 1990-es végén vált üzemkésszé hosszú évek munkájának eredményeképpen az OSZK-tezaurusz. Lexikai állományának kialakításához számos bevált, géppel olvasható hordozón hozzáférhető tezauruszt (OSZKÁR tezaurusz, Taxaurusz, Videotezaurusz, Oktatási intézmények tezaurusza, Szakma tezaurusz, Igazgatási tezaurusz stb.) használt fel Ungváry Rudolf és munkatársai. Az OSZK-tezaurusz tárgyszavazási alkalmazására az OSZK Amicus rendszerének keretében került sor. Az OSZK-tezaurusz nyers változatát 1999-től a közművelődési könyvtárakban próbaosztályozásra használták, és a sikeres eredmények alapján számos könyvtárban vezették be az országban Köztaurusz néven. (Az OSZK-tezaurusz/Köztaurusz részletes ismertetésére a 11.fejezetben kerül sor.) MÁTRIKSZ program A MÁTRIKSZ62 szolgáltatási programra, a vele kapcsolatos tartalmi visszakeresés eszközeire 2001-ben született javaslat. A mozaikszó jelentése: Magyar Átfogó TáRgyi 62
A MOKKA közös katalógus továbbfejlesztése. Szakértői vélemény. Munkaanyag. 2010.03.23. Készítette a MOKKA szakértői munkacsoportja. 154.p. URL: http://www.mokka.hu/files/tamop/A_MOKKA_tovabbfejlesztese_5_20100323.pdf
117
INFORMÁCIÓKERESŐ NYELVEK II. InformációKereső-nyelvi Szótár. A MÁTRIKSZ-on meghatározott rész-szótárak együttműködő rendszerét értjük,63 melyek között az egyiket (OSZK tezaurusz/Köztaurusz) kitüntetettnek tekintik, de használat szempontjából a résztvevő szótárak egymással egyenrangúak. A résztvevő intézmények és a kezdő rekordszámok a következők voltak: − Országos Széchényi Könyvtár – OSZK-tezaurusz/Köztaurursz – cca. 28.000 tárgyi kifejezés, − Debreceni Egyetem Egyetemi és Nemzeti Könyvtár – átfogó tárgyszórendszere – a Library of Congress Subject Headings (LCSH) magyar adaptációja; cca. 25.000 tárgyi kifejezés, − Szegedi Tudományegyetem Egyetemi Könyvtár – átfogó tárgyszórendszere – hagyományos tárgyszórendszer; cca. 60 000 tárgyi kifejezés, A MÁTRIKSZ közös adatbázisa ily módon – cca. 113 000 tárgyi kifejezéssel indult. A résztvevő információkereső-nyelvi szótárak mérete időközben jelentősen kibővült. Önálló tárgyszó adatbázist alkotott, mely független a részvevő intézmények saját bibliográfiai adatbázisaitól, és lekérdezte azokat. A rendszer néhány éves működése után jelenleg szünetel, de felújítása a tervek között szerepel, így pl. a MOKKA fejlesztési tervében is, az alábbiak szerint: „A bibliográfiai rekordok a jelenlegi megoldás szerint tartalmazzák a tárgyi elemeket, de a jelenlegi Mátriksz adatbázis továbbfejlesztésével lehessen a MOKKA-ban reprezentált tárgyszórendszerek, tezauruszok részletes keresésére, az ottani találatok felhasználására egy a MOKKA tárgyszókeresésben, szükség esetén a Mátriksz adatbázisból tárgyszórekordok exportálására a saját rendszerbe.64 (Megj.: Leckénkben általános tárgyszójegyzékekkel, rendszerekkel foglalkoztunk, nem tértünk ki a szakkönyvtári munkában alkalmazott speciális tárgyszórendszerekre és egyéb eszközökre, melyek helyzetéről, alkalmazásáról Varga Katalin felmérése tájékoztat.65 ) 8.3.7 A tárgyszórendszerek értékelési szempontjai Elérkeztünk ahhoz a ponthoz, amikor a tárgyszavazási modul befejezése után, konkrét rendszerek megismerése után értékelnünk kell a tárgyszavazás elméleti, módszertani lehetőségeit, a tárgyszórendszerek helyzetét az információkereső nyelvek „nagy családjában‖. Ismételje át az 5–8. leckét és a vizsgált esetek alapján, röviden, tömören legyen képes választ adni az alábbi kérdésekre egy potenciális zárthelyi dolgozat keretében. − (1) Melyek a megismert tárgyszórendszerek - alkalmazott keresőnyelvek- sajátos ismérvei? Mennyiben szabályozatlanok és mennyire szabályozottak?
63
BÁNKI Zsolt: MÁTRIKSZ – Magyar Átfogó Tárgyi Információkereső-nyelvi Szótár : Új fejezet a tartalmi visszakeresésben = Könyvtári Figyelő, 47. évf. 2001. 4. sz. 672-678. URL: http://epa.oszk.hu/00100/00143/00040/banki.html 64 A MOKKA közös katalógus továbbfejlesztése. Szakértői vélemény. Munkaanyag. 2010.03.23. Készítette a MOKKA szakértői munkacsoportja. 154.p. URL: http://www.mokka.hu/files/tamop/A_MOKKA_tovabbfejlesztese_5_20100323.pdf 65 Varga Katalin: A magyar szakirodalom tartalmi reprezentációjának jelenlegi állapota = Tudományos és Műszaki Tájékoztatás, 52. évf. 2005. 7-8. sz. URL: http://tmt.omikk.bme.hu/show_news.html?id=4008&issue_id=464
INFORMÁCIÓKERESŐ NYELVEK II. −
−
− − −
− −
(2) Mennyire függnek egymástól a fogalmak (és az azokat képviselő tárgyszavak) a megismert tárgyszórendszerekben, vagy mennyire függetlenek egymástól? Mennyire érvényesül a rendszerekben az alá-és fölérendelés, illetve a mellérendelés? (3) Mennyire jellemző az, hogy a tárgyszavakat a feltárás, vagy/és a keresés során egymáshoz rendeljük? Milyennek minősíthetők a tárgyszórendszerek, prekoordináló vagy/és posztkoordináló rendszernek? (4) Milyen mértékben valósul meg a tárgyszavak elektronikus kezelése, elektronikus alkalmazása? Milyen fejlesztési programokat lehet megemlíteni? (5) Mennyire alkalmazhatók a megismert tárgyszórendszerek egyes tudományterületek, szakterületek sajátos keresési igényeinek a kielégítésére? (6) Milyen mélységű feltárást biztosítanak a megismert tárgyszórendszerek? – Mennyire tekinthetők generalizáló (átfogó tárgyszavakkal operáló) rendszereknek? Mennyire tekinthetők egyedi, specifikus fogalmak, dolgok és jelenségek feltárására alkalmas rendszereknek? (7) Milyen célokra használhatók a megismert tárgyszórendszerek? Tudományok osztályozására, ismeretreprezentációra, ismeretközvetítésre, ismeretszervezésre? (8) Hogyan alakul a megismert tárgyszórendszerek alkalmazásának a hatóköre? (nemzetközi, országos, helyi szinten)
8.4
ÖSSZEFOGLALÁS
Az általános magyar tárgyszórendszerek közül először részletesen megismerhette a fejlődéstörténeti szempontból is jelentős Új Könyvek tárgyszórendszert. Először létrejöttének, fejlesztéseinek tényeit ismerte meg. Majd részletes áttekintést kapott a tárgyszószabályozás egyes területeiről. Példákon keresztül áttekintést nyert az alaktani, szótani, jelentéstani szabályozásról. A tárgyszavak közötti logikai kapcsolatok ábrázolására is kifejlesztettek eszközöket. A tárgyszókategóriákat példákon keresztül ismert meg, melyekhez saját példákat is fűzhet. Az indexelés sajátos szabályainak megismeréséhez számos példát tanulmányozhatott. Végül áttekintettük a rendszer alkalmazásának eredményeit és tapasztalatait. Ezt követően az LCSH-nak, a Kongresszusi Könyvtár tárgyszórendszerének magyar változatát ismerhette meg, melyet a Debreceni Egyetem Egyetemi és Nemzeti Könyvtára (DEENK) gondoz. Példákon keresztül áttekinthette, hogyan tárgyszavazza a DEENK a magyar könyvtermést az LCSH angol nyelvű tárgyszavai mellett magyarul változatban (fordításban) is. A fentiekhez kapcsolódva rövid betekintést nyert a tárgyszavazás olyan fejlesztési vonulataiba, mint az Általános Tárgyszó Jegyzék (ÁTJ)-tervezet, az OSZK-tezaurusz/Köztaurusz fejlesztés, valamint a MÁTRIKSZ-program), és a közös katalógusfejlesztések ezirányú eredményeibe. A leckét a tárgyszó-rendszerek átfogó értékelési szempontjai zárják.
119
INFORMÁCIÓKERESŐ NYELVEK II.
8.5
ÖNELLENŐRZŐ KÉRDÉSEK
1.
Elemezze az Új Könyvek tárgyszójegyzék fejlesztésének motívumait, fő állomásait!
2.
Melyek az ÚK tárgyszójegyzék fejlesztésének, és alkalmazásának fő vonásai?
3.
Tekintse át az ÚK tárgyszójegyzék tárgyszókategóriáit!
4.
Értékelje a szabályozás területeit és megoldásait az Új Könyvek tárgyszójegyzék esetében!
5.
Melyek az ÚK tárgyszójegyzék alapján végzett indexelés fő jellemzői?
6.
Mi a jelentősége a DEENK tárgyszavazási gyakorlatának?
7.
Mi a jelentősége a MÁTRIKSZ programnak?
8.
Foglalja össze röviden a VOCAL tárgyszó-adatbázis jelentőségét!
9.
Hasonlítsa össze a tárgyszavazás magyarországi, illetve amerikai fejlesztésének fő vonásait!
10. Röviden értékelje a két magyarországi tárgyszórendszer (Új Könyvek tárgy-
szójegyzék ill. DEENK) jellemzőit egy kiválasztott értékelési szempont alapján!
INFORMÁCIÓKERESŐ NYELVEK II.
9. INFORMÁCIÓS TEZAURUSZOK - BEVEZETÉS 9.1
CÉLKITŰZÉS
A lecke feldolgozásával legyen képes − a tezaurusz fogalmának értelmezésére, − a tezaurusz részeinek és azok funkcióinak bemutatására, − a tezaurusz fajtáinak kifejtésére, rövid jellemzésére, − az előállítás módjának bemutatására, − a kereshető ismérvek kifejtésére, − a tezaurusz használatából adódó előnyök kifejtésére, − a problémák elemzésére.
9.2
TARTALOM
1. Á tezaurusz helye a szabályozási spektrumban – A tezaurusz fejlődéstörténete, típusai – A tezaurusz fogalma, lényegi ismérvei – A szabályozás szigorúsága – A deszkriptor és nem-deszkriptor összefüggései 2. A tezaurusz szabványban meghatározott részei – A tezaurusz fő része a deszkriptorcikkel – A deszkriptorcikk egyes elemei – A vezérdeszkriptor kapcsolatai és azok ábrázolása 3. A fő részt kiegészítő részek – Jelentésköri rész – Hierarchikus rész – Betűrendes (permutált) rész – A tezaurusz grafikus (vizuális) része – A tezaurusz kiegészítő részei 4. A tezaurusz értékelése, fejlesztése
9.3
A TANANYAG KIFEJTÉSE
9.3.1 A tezaurusz helye a szabályozási spektrumban A tezaurusz fejlődéstörténete, típusai Egy laikusnak a „tezaurusz‖ kifejezés a 'dinoszaurusz', valamely fajtáját juttatja eszébe, feltehetően a két görög eredetű szó sajátos összecsengésének köszönhetően. Az asszociációnak persze semmi jelentésbeli alapja nincs: a dinoszaurusz őshüllőt, a tezaurusz (thesaurus) pedig kincset, kincstárat jelent. Hogy milyen „kincsről‖, „kincstárról‖ van szó, azt az alábbiakban fejtjük ki. 121
INFORMÁCIÓKERESŐ NYELVEK II. A tezaurusz szónak 3 fő jelentése alakult ki az idők során: (1) Tudományos értelemben vett tezaurusz – Tudományos, nagy anyaggyűjtemény; nagy gyűjteményes mű. A tezaurusz legrégebbi típusa, az ókorban és a középkorban igen elterjedt volt. Ma már ebben az értelemben ritkán használjuk. (2)Nyelvészeti/ értelemben vett tezaurusz – Egy nyelv szókincsének java részét felölelő gazdag szótár. Az 1850-es években jelent meg a Peter Mark Roget (ld. melléklet) által kidolgozott ma is élő, újabb és újabb kiadásban megjelentetett angol nyelvi thesaurus, mely az angol szavak, kifejezések összefüggéseit relációit mutatja be. (3)Információs tezaurusz – Az információk rendszerezett és sokrétű feldolgozását és keresését segítő fogalomgyűjtemény. Összefügg mind a tudományos tezaurusszal (egy-egy szakterület fogalmait tárja fel), mind a nyelvészetivel (rendszerezi a nyelvi, plusz logikai összefüggéseket). Az 1960-as években jelent meg, szintén az angolszász országokban, azzal összefüggésben, hogy a kifejlődő számítógépes adatbázisokban erőteljes igény jelentkezett az egyes tudományok fogalmait pontosan, megbízhatóan, sokszempontúan tükröző információkereső nyelvek iránt.
30. kép
Peter Mark Roget (1779–1869)
Az információs tezaurusz feladata az, hogy segítse az egyes tudományterületen az információfeldolgozást és -keresést. Eközben az alábbi fő elvárásoknak kell megfelelnie: − (1) építsen a természetes nyelvre, de az egyértelműség kedvéért legyen szigorúan szabályozott,
INFORMÁCIÓKERESŐ NYELVEK II. − − − −
(2) mutassa ki következetesen a fogalmak közti legfontosabb logikai kapcsolatokat (nem, faj, rokonsági). (3) sokféleképpen rendszerezze és tegye kereshetővé a fogalmakat, (4) legyen rugalmasan továbbépíthető és naprakész. (Megj.: mivel a továbbiakban csak a információs tezauruszokkal foglalkozunk, azokat – leegyszerűsítve – tezaurusznak nevezzük.) A tezaurusz fogalma, lényegi ismérvei A tezaurusz természetes nyelven kifejezett fogalmak olyan tartalmilag szabályozott, szükség szerint változtatható szótára, amelyben feltüntetik a legfontosabb fogalmi összefüggéseket. A tezaurusz fő rendeltetése információk feldolgozása és keresése.66
A tezaurusz – valamely szakterület természetes nyelven kifejezett fogalmainak szabályozott, szükség szerint változtatható szótára. Legfőbb ismérvei: − összetett szótár, − egy-egy tudományterület/szakterület fogalmait fejezi ki természetes nyelven, − a fogalmakat, illetve az azokat képviselő keresőnyelvi kifejezéseket erősen szabályozott formában fejezi ki, − a fogalmak közt feltárja és feltünteti a legfontosabb logikai stb. kapcsolatokat, − több részből tevődik össze, melyek mindegyike meghatározott funkciót tölt be a feldolgozás és keresés segítésében. Az egyes tezauruszok sajátos ismérvekkel rendelkezhetnek, pl. nyelvüket, szakterületüket, bővíthetőségüket, alkalmazásukat stb. illetően. A szabályozás szigorúsága A tezaurusz a tárgyszavazáshoz képest – erősebben szabályozott. A tezaurusznak szabvány határozza meg a részeit, azok funkcióit, egymáshoz való kapcsolatát! A legrégibb ilyen szabvány az USA szabványa: ANSI X.39.15-1974, American National Standard – Guidelines for thesaurus structure, construction and use címen jelent meg. Az ISO nemzetközi tezaurusz-szabványt 1986-ban adták ki ( ISO 2788-86 szabvány), A magyar szabvány 1987-ben követte ezt a Magyar nyelvű információkereső tezauruszok szerkezete, részei és formái (MSZ 3418-87) címen. A szabványokat a legújabb fejlemények (különösen az automatikus osztályozás és indexelés követelményei) miatt napjainkban revideálni kell. A deszkriptor és nem-deszkriptor fogalma és összefüggései A deszkriptor valamely tudományos, szakterületi fogalom uniformalizált, szigorúan kötött szakkifejezése (lexikai egysége), mely az osztályozáshoz, az információk szabványos 66
Magyar nyelvű információkereső tezauruszok szerkezete, részei és formái. Budapest: 1987. (MSZ 3418-87)
123
INFORMÁCIÓKERESŐ NYELVEK II. leírásához, illetve kereséséhez közvetlenül alkalmazható. (Megj.: a deszkriptor latin eredetű szó, mely a describere (magyarul leírni) szóból származik.) A nem-deszkriptor a deszkriptorral azonos értelmű, de a keresőnyelvben tiltott, csak közvetve alkalmazható kifejezés. A tezaurusznak – mint különleges szótárnak, vagy fogalomgyűjteménynek – elemei a fogalmak. Ezek lexikai egységek (egyes szavak, szóösszetételek) formájában jelennek meg. Egy fogalmat egyetlen lexikai egységgel kell leírni. Egy lexikai egységnek pedig egyetlen fogalomnak kell megfelelni. A „lelki élet jelenségeivel foglalkozó tudomány‖ fogalmát a magyar nyelvben kétféleképpen is kifejezhetjük, a „pszichológia”, illetve a „lélektan” szavakkal. A használói kör, cél stb. mérlegelésével el kell dönteni, hogy melyik legyen az előnyben részesített lexikai egység, azaz deszkriptor. Hasonló döntési helyzet áll fenn a geológia vagy földtan, illetve a diabetes mellitus vagy cukorbetegség között. 9.3.2 A tezaurusz szabványban meghatározott részei 27. Áttekintés a tezaurusz szabványban meghatározott részeiről
Sorszám/Megnevezés (1) Főrész (2) Jelentéskörök szerinti rész (3) Hierarchikus rész (4) Permutált betűrendes rész (mutató) (5) Grafikus rész
Meghatározás a részletes deszkriptorcikkeket tartalmazza a deszkriptorokat fazetták (alkategóriák) szerint rendezve tartalmazza a deszkriptorokat hierarchikus rendszerben tartalmazza a lexikai egységeket – deszkriptorokat és nemdeszkriptorokat – egyetlen betűrendben tartalmazza, az összetett kifejezéseket permutáltan is bemutatja a lexikai egységek közötti relációkat grafikus módon ábrázolja
(6) Egyéb részek, mutatók A tezaurusz fő része a deszkriptorcikkekel A főrész a részletes deszkriptorcikkeket (tezauruszcikkeket) tartalmazza, általában betűrendben. A deszkriptorcikk olyan szótári egység, mely tartalmazza az adott fogalom jelölésére szolgáló deszkriptort, a használatával kapcsolatos magyarázatokat, a deszkriptor szinonimáját/szinonimáit, a deszkriptorral logikai kapcsolatban álló további deszkriptorokat.
INFORMÁCIÓKERESŐ NYELVEK II. 28. A deszkriptorcikk elemei
Az elem megnevezése a) vezérdeszkriptor b) magyarázó jegyzet vagy tárgyköri megjegyzés c) a szinonimák felsorolása d) a vezérdeszkriptorral logikai kapcsolatban álló deszkriptorok felsorolása
Mit tartalmaz? az adott fogalom jelölésére szolgáló deszkriptort a használatával kapcsolatos magyarázatokat a deszkriptor szinonimáját/szinonimáit a deszkriptorral logikai kapcsolatban álló további deszkriptorokat
A deszkriptorcikk egyes elemei Magyarázó jegyzet, megjegyzés A deszkriptorcikkben a vezérdeszkriptort követő elem, annak használatával kapcsolatos. Az igényes tezauruszokban kiérlelt, részletesen kimunkált elem. Szinonimák A szinonimák jelölése a deszkriptorcikk általában második eleme. Mint a tárgyszavazás tárgyalásánál már megismertük, a szinonima olyan kifejezés, amelynek a jelentése vagy teljesen vagy csaknem teljesen azonos a tárgyszóéval, esetünkben a deszkriptoréval. A szinonimát nem használhatjuk sem indexelésre, sem keresésre; helyette itt a deszkriptort kell használni. Lehetőleg minden szinonimát fel kell feltüntetni. A logikai összefüggések jelölése Ezek jelölése az egyes tezauruszoknál egységesen történik. Ugyanakkor bevett gyakorlat, hogy a szabványos jelölés helyett a felhasználók számára készülő és a keresést segítő felületeken felhasználóbarát, könnyen értelmezhető jelölést alkalmaznak. A vezérdeszkriptor kapcsolatai, azok ábrázolása A vezérdeszkriptor kapcsolatait az OSZK-tezaurusz/Köztauursz példáján keresztül mutatjuk be táblázatosan két részletben, először az irányított kapcsolatok közül a nem-faj (generikus), és szerkezeti (egész-rész) kapcsolatokat, azok szabványos és felhasználóbarát jelölését mutatjuk be a rendszerből vett táblázat felhasználásával: 29. Alá- és fölérendelt, illetve rész-egész deszkriptor kapcsolatok jelölése Kapcsolattípus
Szabv. jelölés
Felhasználóbarát jelölés
Fölérendelt fogalom
F
= Lásd még általánosabban:
Alárendelt fogalom
A
= Lásd még speciálisabban
Példák BARLANGÁSZAT F Természetjárás TERMÉSZETJÁRÁS A Barlangászat
125
INFORMÁCIÓKERESŐ NYELVEK II. Kapcsolattípus
Szabv. jelölés
Felhasználóbarát jelölés
Egész fogalma (T=totum)
T
= Lásd még átfogóbban:
Rész fogalma (P=Pars)
P
= Lásd még részletesebben:
Példák OKTATÁS T Oktatásügy OKTATÁSÜGY P Oktatás
A második körben további irányított kapcsolatokat mutatunk be a megismert sorrendben: 30. Ok-okozat, eszköz-rendeltetés, előfeltétel-következés, rokonsági kapcsolatok és
jelölésük Kapcsolattípus Ok-okozati összefüggés: A Deviancia következménye (lehet) a Bűnözés Eszköz-rendeltetés kapcsolat tevékenység és tevékenység között: Eszköz-rendeltetés kapcsolat tudomány és tevékenységi kör között. Előfeltétel (kiindulásrezultáns) következés kapcsolat Rokonsági (egyéb) kapcsolat – A vezérszóval egyéb, a tezauruszban lényegesnek tekintett kapcsolat
szabv. felhasználóbarát jelölés . jelölés R
R
R
E
X
példák
DEVIANCIA = Lásd még oksági R összefüggésben Bűnözés = Lásd még eszKULTURÁLIS CSERE köz-rendeltetés R összefüggésben Szakképzés = Lásd még eszORVOSTUDOMÁNY köz-rendeltetés R összefüggésben Gyógyítás BŰNÖZÉS = Lásd még okozati E összefüggésben Deviancia = Lásd még egyéb összefüggésben:
ÉHÍNSÉG X Szegénység
Fogalmi és „nem fogalmi” összefüggések A fenti táblázatban hozott példákhoz kapcsolódva a fogalmi és „nem fogalmi‖ összefüggések sajátosságaira hívjuk fel a figyelmet. Fogalmi összefüggések alatt elsősorban a nem-faj (generikus) összefüggéseket értik, melyek valóban fogalmak között állnak fenn. Az egész-rész (partitív) összefüggések esetében, tudatában kell lennünk annak, hogy ezek valójában a fogalmakkal reprezentált dolgok között állnak fenn. Mint láthattuk, más sokrétű összefüggést is feltüntetnek, így a különféle oksági (okokozat, eszköz-rendeltetés, tevékenység-cél stb.) és egyéb, asszociatív összefüggéseket (pl. tulajdonsága, ellentéte stb.), bár tudatában vannak annak, hogy nem állítható egyértelműen, hogy alapvetően fogalmi kapcsolatokról van szó.
INFORMÁCIÓKERESŐ NYELVEK II. 9.3.3 A fő részt kiegészítő részek Föntebbiekben már táblázatosan képet adtunk a tezaurusz szabványban megadott részeiről: (1) főrész, (2) jelentéskörök szerinti rész, (3) hierarchikus rész, (4) permutált betűrendes rész (mutató), (5) grafikus (vizuális) rész, (6) Egyéb részek és mutatók Nézzük meg ezeknek a kiegészítő részeknek a fő ismérveit. Jelentésköri rész A jelentéskör szerinti rész lényege, hogy egy-egy átfogó fogalom alatt betűrendben csoportosítja a hozzátartozó deszkriptorokat. A csoportosítás történhet fogalmi kategóriák, illetve a belőlük levezetett fazetták alapján. A csoportosítást szolgáló legfontosabb és legáltalánosabb alkategóriák – fazetták: − entitás, objektum, dolog, tárgy, pl. könyv − folyamat, cselekvés, tevékenység, pl. feldolgozás, keresés − tulajdonság, jellemző jegy, pl. relevancia, rugalmasság, − produktum, termék, pl. tárgyszókatalógus, adatbázis − cél, rendeltetés, pl. tanulás − ok, feltétel, pl. zaj, csatorna Milyen értéket ad a jelentésköri rész a tezaurusznak? A fogalmi kategóriák, az azokból levezetett fazetták alkalmazásával tudatosabbá teszi a feldolgozást és a keresést is, mind a feldolgozó könyvtárosnak, mind pedig a felhasználónak, akiknek rendszeresen végig kell gondolni a fenti fazetták alkalmazhatóságát. A jelentésköri részben lehetnek kisebb-nagyobb különbségek az alkategóriák szerint. A Magyar pedagógiai tárgyszójegyzék szakcsoportos részén belül a 8 közös (bárhol használható) tárgyszavak köre: − 801 Cselekvés, folyamatok − 802 Dolgok. Elvont és konkrét entitások − 81 Hely, tér − 83 Dokumentumtípusok − 84 Modifikátorok E tárgyszavak jól hasznosíthatók voltak a PRECIS szerinti indexeléshez. Hierarchikus rész A szakrendi rész lényege, hogy az egyes szakterületek fogalmait hierarchikus, logikai szempontok szerint rendszerezi. E rendszer nem olyan mély, mint az ETO, melyben akár 8-10 hierarchiaszint (vagy több) is követheti egymást. A tezaurusz szakrendi mutatója sekélyebb, 3-4 hierarchiaszintig bontja és rendszerezi a szakterület fogalmait képviselő deszkriptorokat. A logikai rendszer egyaránt segíti a feldolgozó szakembert a feldolgozás során, a felhasználót pedig a keresés során. A szakrendi rész rendelkezik a hierarchikus rendszerek jellemzőivel (mélységben rugalmas, áttekinthető, részletesen mutatja az alá-fölérendeltségi relációkat). Ilyen szakrendi résszel rendelkezik pl. a Könyvtári és tájékoztatási tezaurusz, 127
INFORMÁCIÓKERESŐ NYELVEK II. melyet a MAKSZAB (Magyar Könyvtári Szakirodalom Bibliográfiája) kiadványban a tételek rendszerezésére használ. Ugyancsak van szakrendi része a Magyar pedagógiai tárgyszójegyzéknek is. Betűrendes (permutált) rész A betűrendes rész a tezaurusz legteljesebb, mechanikus rendezésű szótári jegyzéke. Egységes betűrendben tartalmazza a deszkriptorokat, illetve a nem-deszkriptorokat. Adott kérdéshez, témához tartozó deszkriptorok gyors és pontos megtalálását segíti. Gyorsan áttekinthető, rugalmasan bővíthető, sokrétűen kereshető. Ilyen részt tartalmaz pl. a Könyvtári és tájékoztatási tezaurusz (KTT) 1992. évi kiadása, vagy a Magyar pedagógiai tárgyszójegyzék. A permutált betűrendes rész amellett, hogy egy betűrendben tartalmazza a deszkriptorokat és nem-deszkriptorokat, a többtagú kifejezések esetén – azok permutált (inverz) változatait is tartalmazza. Egy-egy deszkriptor, ill. nem-deszkriptor annyiszor jelenik meg a permutált részben, ahány írásmódját ciklikusan permutáljuk. Példa kéttagú kifejezések permutációjára a KTT-ben: vállalati irodalom 50950 MŰSZAKI KISNYOMTATVÁNY 50895 irodalom – vállalati 50950 kisnyomtatvány – műszaki 50895 (Megj.: (1) A nagybetű azt jelenti, hogy deszkriptorról van szó. (2) Az ötjegyű számok a deszkriptor főrészbeli sorszámát jelölik). A fentiek alapján a permutált betűrendes mutató 3 fő funkciója: − betölti a sima betűrendes mutató funkcióját (elvezet a deszkriptorhoz), − segít a megfelelő deszkriptor megtalálásában akkor is, ha a kiinduló szó vagy kifejezés egy összetett deszkriptornak valamely utótagja, második, harmadik eleme csupán, − rendező funkciót tölt be a többtagú kifejezések permutációjával. A tezaurusz grafikus (vizuális) része A tezaurusz grafikus része a hivatalos elnevezés, bár az utóbbi időben terjed a „vizuális‖ jelző. Ez a rész a tezauruszban feltárt ismeretág, szakterület legfontosabb fogalmait és azok relációit gráfokkal mutatja be. Célja, hogy a kapcsolatrendszert áttekinthetően, szemléletesen ábrázolja. A grafikus részben a relációk jelölhetik a fogalmak logikai kapcsolatait, a relációk tulajdonságait (aszimmetrikus, szimmetrikus), a kapcsolat erősségét, intenzitását stb. Ezt a részt általában a készítés során állítják elő. A mellékelt ábra a magyar leírószófajtan tezaurusz grafikus áttekintésének egy kiemelt részét tartalmazza67
67
RÓNAI Mónika: Információkereső tezaurusz a magyar leírószófajtan témaköréből = Tudományos és Műszaki Tájékoztatás. 56. évf. 2009. 5. sz. URL: http://tmt.omikk.bme.hu/show_news.html?id=5143&issue_id=504
INFORMÁCIÓKERESŐ NYELVEK II. A mellékletben bemutatott példa a szófajok összefoglaló táblázata. A lexikai egységeket címkézett, irányított gráfok formájában jeleníti meg, a szavak közti összefüggéseket irányított gráfok éleivel ábrázolja. Az ábra középpontjában az adott szócsoport csúcsdeszkriptora, az alábbi példában a szófaj található, tipográfiailag kiemelve. A többi deszkriptor minden irányból körülveszi ezt. A leírószófaj-tezaurusz vizuális részében a nemdeszkriptorokat egyenlőségjel, a rokonsági (X) kapcsolatokat kétirányú folytonos gráfél, a generikus (F/A) kapcsolatokat az alárendelt fogalomtól a fölérendelt felé irányuló, folytonos, egyirányú gráfél jelöli. Több, azonos szempont szerint alárendelt deszkriptort két oldalról bekeretezve, egymás alatt betűrendben, néhol helyhiány miatt vont össze. Erre leginkább a határozószó és a tulajdonnév fajtáinál volt szükség.
31. kép
Magyar leírószófajtan tezaurusz grafikus vizuális áttekintése 129
INFORMÁCIÓKERESŐ NYELVEK II. A tezaurusz kiegészítő részei A tezauruszok nagy segítséget jelentenek a minőségi (sokszempontú, egyértelmű, mélységben rugalmas) feldolgozásban és keresésben, ugyanakkor általában nem tartalmaznak konkrét földrajzi neveket, személyneveket, intézményneveket, típusneveket, programneveket, jóllehet ezek a finom tájékozódáshoz szükségesek lehetnek. A rendszerben való gondolkodást mutatja, hogy ezekről sem feledkeznek meg, és a feldolgozás más ágából leképezett konkrét intézménynevek, földrajzi nevek, személynevek, dokumentumtípusok betűrendes részeihez elvezetnek, mintegy a tezaurusz kiegészítéseként. (Pl. a Könyvtári és tájékoztatási tezaurusz deszkriptorai révén rendszerezett MAKSZAB – Magyar Könyvtári Szakirodalom Bibliográfiája indexrendszerében). 9.3.4 A tezaurusz értékelése, fejlesztése A tezauruszépítés és fejlesztés magában foglalja az adott szakterület terminológiai kontrollját. Tezauruszépítésbe akkor érdemes fogni, ha elengedhetetlen a fogalmak közötti viszony mélyebb kidolgozása. A tezaurusz fő része a deszkriptorcikkekkel, a megjegyzések, a szinonimák feltüntetése, a logikai összefüggések feltüntetése, valamint a fő részhez kapcsolódó, azt kiegészítő további részek (pl. szakrendi, grafikus-vizuális) alkalmazása mind a feldolgozást, mind pedig a keresést hatékonyabbá, tudatosabbá teszi. Különösen fontos a logikai összefüggések következetes feltüntetése a deszkriptorcikkekben. Ennek segítségével a feldolgozó szakember pontosabban, jobban képezheti le az ismeretegységet, az összes lehetséges deszkriptor-alternatíva figyelembevételével. Ugyanígy a keresésnél a felhasználó a keresőkérdés megfogalmazásához a tezaurusz gondos tanulmányozásával a legmegfelelőbb deszkriptorokat választhatja ki, illetve kombinálhatja. A tezauruszok építésére, készítésére, kezelésére szoftvereket fejlesztettek ki, melyek megkönnyítik a „fogalmi építkezést‖ (Ilyen pl. a RELEX szoftver, mely az OSZK-tezaurusz/Köztaurusz építését, szerkesztését, gondozását szolgálja.). Ezek nélkül ma már a fejlesztés elképzelhetetlen, keretrendszerként segítik az ellenőrzött szótárú rendszerek kidolgozását, de a fogalmi rendszer kifejlesztéshez sok szellemi munka, szakértelem, módszertani tudás, idő is szükséges. Korábban a tezauruszok nyomtatott formában, szükség szerinti példányszámban, több száz, sokszor több mint ezer oldalon jelentek meg. Ennek is vannak előnyei, ugyanakkor a hálózati online megjelenés mind a feldolgozás, mind pedig a felhasználás szempontjából hatékonyabb megoldásokkal szolgál. A Magyarországon készített, gondozott tezauruszokat a 10. lecke elején tekintjük át.
9.4
ÖSSZEFOGLALÁS
A tezauruszok az 1960-as években jelentek meg az információkereső nyelvek sorában. Mind nyelvi, mind logikai értelemben a legerősebben szabályozott keresőnyelvek. Szemantikai információkereső nyelvként való értelmezésük jelzi növekvő szerepüket a web 3.0-nak is nevezett szemantikus web alkalmazásokban. E leckében betekintést nyert a tezaurusz mint szabályozott keresőnyelv ismérveibe, megismerte funkcióit, funkcionális
INFORMÁCIÓKERESŐ NYELVEK II. részeit (főrész, jelentéskörök szerinti rész, hierarchikus rész, permutált betűrendes rész, grafikus-vizuális rész), és azok szerepét az egyértelmű, pontos feltárásban és keresésben. Példákon keresztül megismerte a deszkriptorcikk szerkezetét, az egyes szerkezeti elemek szerepét és szabványos, illetve felhasználóbarát jelölési módját. Betekintést nyert a tezauruszépítés, -fejlesztés, -alkalmazás műhelytitkaiba, a tezauruszban való keresés pedig az egész félév egyik kiemelt feladata volt. Rendelkezik azokkal az alapismeretekkel, melyek alapján a kurzus két hátralevő leckéjében konkrét tezaurusz rendszerek sajátos alkalmazásait, sajátos jellemzőit megértheti.
9.5
ÖNELLENŐRZŐ KÉRDÉSEK
1.
Értelmezze a tezaurusz három típusának fogalmát!
2.
Sorolja fel a deszkriptorcikk összetevőit, és azok funkcióit egy példán keresztül!
3.
Vegye sorba a főrészen kívüli további részeket, és röviden mutassa be őket!
4.
Mi a hasonlóság és a különbség a nem-faj, és az egész-rész összefüggések között?
5.
Fejtse ki a tezauruszok használatából, különös tekintettel a szabályozottságból, fakadó előnyöket!
6.
Vegye számba a deszkriptorcikk elemeit, és fejtse ki sajátos funkciókat!
7.
Értelmezze részletesen a jelentésköri rész szerepét!
8.
Miért fontos, sőt nélkülözhetetlen a szakrendi rész?
9.
Ismertesse a grafikus rész szerepét, alkalmazott jeleit!
10. Értelmezze a tárgyszó és deszkriptor, a tárgyszórendszer és tezaurusz kapcso-
latát! 11. Véleménye szerint feleslegessé teszi-e a tezaurusz a szabályozatlan kereső-
nyelvek használatát?
131
INFORMÁCIÓKERESŐ NYELVEK II.
10. MAGYARORSZÁGI TEZAURUSZOK. A KÖNYVTÁRI ÉS TÁJÉKOZTATÁSI TEZAURUSZ
10.1 − − − − − − − − −
CÉLKITŰZÉS
A lecke feldolgozásával legyen képes a magyarországi tezauruszok fejlődéstörténetének bemutatására, az élő, használt tezauruszok rövid bemutatására, a magyarországi tezauruszfejlesztések értékelésére, a Könyvtári és tájékoztatási tezaurusz fejlődéstörténetének bemutatására, a tezauruszcikkei sajátosságainak kifejtésére, az alkalmazott reláció-jelölések változásának, változatainak magyarázatára, kiegészítő részeinek, azok funkcióinak bemutatására, a MANCI adatbázisban való használati módszerek bemutatására, különös tekintettel a tezaurusz-funkcióra, további alkalmazásainak (Könyvtártudományi szakkönyvtár, MAKSZAB, Könyvtári Figyelő) bemutatására.
10.2
TARTALOM
1. A magyarországi tezaurusz-fejlesztések – A fejlesztések áttekintése dióhéjban – A tezauruszok felosztása használatuk időtartama szerint – Ma is élő, bemutatásra kerülő tezauruszok – A fejlesztések értékelése 2. A Könyvtári és tájékoztatási tezaurusz (KTT) – A tezaurusz fejlesztésének csomópontjai – A tezaurusz alkotóelemei 3. A tezaurusz fő része – A szinonimák és kváziszinonimák kezelése – A logikai kapcsolatok és kezelésük 4. A tezaurusz kiegészítő részei – A hierarchikus rész – A permutált betűrendes rész 5. A tezaurusz alkalmazása a MANCI adatbázisban – A MANCI adatbázis szolgáltatásai – A keresési, böngészési és tezaurusz-funkciók – A deszkriptorcikkek szerkezete és jelölései 6. A KTT további alkalmazásai – OSZK Könyvtártudományi szakkönyvtár – Magyar Könyvtári Szakirodalom Bibliográfiája (MAKSZAB) – Könyvtári Figyelő
INFORMÁCIÓKERESŐ NYELVEK II.
10.3
A TANANYAG KIFEJTÉSE
10.3.1 A magyarországi tezaurusz-fejlesztések A fejlesztések áttekintése dióhéjban Az 1970-es évektől eltelt időszakban több mint 50 tezaurusz készült Magyarországon. Ezeknek azonban csak egy része aktív és érhető el gépi adathordozón, hálózaton; ellátva felhasználóbarát tezaurusz-szerkesztő programmal. A magyarországi tezaurusz legjobb, legalaposabb ismerője Ungváry Rudolf vette számba, hogy hány és milyen tezaurusz készült és hogy ezeket milyen mértékben használták, használják. Az elkészült tezauruszok listáját Ungváry Rudolf állította össze.68 Figyelembe véve, hogy világviszonylatban is csak az 1960-as évek elejétől jöttek létre tezauruszok, nagy eredmény, hogy az 1970-es, 1980-as években szinte minden évben készült egy tezaurusz Magyarországon (így 1970-ben az Általános műszaki fogalmak tezaurusza1-3. kötete, 1971-ben a Földtani tezaurusz, 1973-ban a Számítástechnikai fogalmak tezaurusza stb. 1975-ben, illetve 1977-ben 5-5 tezaurusz született). Az 1970-es évek végén, 80-as évek elején készült el az Oktatástechnológiai tezaurusz, 1976-ban jelent meg a Könyvtári és tájékoztatási tezaurusz első kiadása (akkor még tárgyszójegyzék néven). A tezauruszkészítésben elsősorban a szaktájékoztatási-ágazati központok, valamint az Országos Széchenyi Könyvtár jeleskedtek. A tezauruszok fejlesztését megfelelő módszertani képzések előzték meg. Az alkalmazások előkészítésével, módszeres végrehajtásával azonban (mint mindjárt láthatjuk, gond volt). A tezauruszok felosztása használatuk időtartama szerint A tezauruszokat a használatuk alapján 4 kategóriába sorolhatjuk: (1) használatukra nem került sor, (2) pár hónapig használtak, (3) több éven át használtak, és végül (4) újabb fejlesztésűek/illetve ma is használatosak. A továbbiakban példákkal illusztrálva, rövid felsorolást adunk ezekről (1) Nagy munkával elkészült tezauruszok, melyek használatára nem került sor Időrendben bemutatva ide tartoznak pl. Az 1970-es évekből a Járműipari szaktezaurusz : a kohó- és gépipar „Járműipar‖ szakágazatának tezaurusza (1975–77), a Műszeripari szaktezaurusz: a kohó- és gépipar „Műszeripar‖ szakágazatának tezaurusza (1975–77), a Gépipari szaktezaurusz: a kohó- és gépipar „Gépek és gépi berendezések‖ szakágazatának tezaurusza (1975–77), Az 1980-as évekből a Kulturális fejlődés nemzetközi tezaurusza: információkereső tezaurusz (1980), a Magyar külgazdasági tezaurusz (1983). A Kartográfiai tezaurusz I.: főrész és grafikus hálók (1985).
68
Ungváry Rudolf: A tezauruszokról. URL: http://www.oszk.hu/hun/szakmai/tezaurusz/tezaurusz_oszk_hu.htm
133
INFORMÁCIÓKERESŐ NYELVEK II. (2) Csak rövid ideig, néhány hónapig használt tezauruszok Ide tartozik pl. Gépgyártástechnológiai szaktezaurusz (1975), a Vaskohászati szaktezaurusz (1975), az Erősáramú elektrotechnikai szaktezaurusz (1975). (3) Hosszabb ideig (néhány évig) használatos, de ma már nem élő tezauruszok Ide tartozik pl. az Építésügyi tezaurusz (1984-), Számítástechnikai tezaurusz (19821990-es évek eleje), az Ipari formatervezési tezaurusz (1985-1990-es évek eleje). (4) újabb fejlesztésűek, napjainkig használatosak AltaVizsla tezaurusz. Az AltaVizsla egységesített keresőszavainak szótára : 1.0 változat (AltaVizsla tezaurusz súgó: http://altavizsla.origo.hu Számítógéppel kezelt, online használt állomány. Kezelőrendszer: MAYA (később tervezett kezelőrendszere Origo fejlesztés). Kiinduló szövegformátumban elkészült tezauruszát a RELEX kezelte. Az AltaVizsla keresőszolgáltatás tezaurusza. Szakma tezaurusz: 1.0 változata 1991-92, 5.3 változat: 1999. – A Magyar Telefonkönyvkiadó Társaság „Arany oldalak‖ szakmai telefonkönyvének szakmai címszavait rendező tezaurusz Távközlési tezaurusz (1990-94), A Magyar Posta Központi Könyvtárának tezaurusza. OSZKÁR tezaurusz: műszaki, mezőgazdasági, természettudományi és gazdasági fogalmak makrotezaurusza a Műszaki Könyvtárak Osztott Katalogizálási Rendszere számára: 3.0 változat, 1.0 változat : 1988-1992, 2.0 változat: 3.0 változat: 1999. Osztaurusz: periodika osztályozási rendszer és tezaurusz, 1. kísérleti változat: 1983-84, 1.0 változat: 1990-95, 2.0 változat: 1996Doktaurusz: dokumentumtípusok tezaurusza : 1.0 változat, 1999. A fentiek mellett szintén az OSZK-ban használatos: Videotezaurusz: film- és videodokumentumok osztályozási rendszere : 1.0 változat: 1997. – 1.1 változat :1998. – Az OSZK NEKTÁR rendszerében a mozgókép dokumentumok osztályozásának tezaurusza. Ma is élő, bemutatásra kerülő tezauruszok Könyvtári és tájékoztatási tezaurusz – 1976. évi kiadása óta folyamatosan használják, gondozója az OSZK Könyvtári Intézet Könyvtártudományi Szakkönyvtára. Sokrétű könyvtári alkalmazásai miatt részletesen ismertetjük a lecke 2. fejezetétől. OSZK-tezaurusz/Köztaurusz. – (OSZK-tezaurusz, 2000, újabb változat: 2002 – A legnagyobb, legszélesebb körben használt tezaurusz. Az OSZK-tezaurusz/Köztaurusz a társadalom-, és természettudományok fogalmait tartalmazó része a rendszernek, a szakkifejezéseket, kapcsolataikat, valamint a formai (dokumentumtípus-) kifejezéseket tartalmazza. Az Országos Széchényi Könyvtárban és a közművelődési könyvtárakban a dokumentumok tartalmi feltárásához és kereséséhez használható. A Taxaurusz és a Geotaurusz és Geohistaurusz és az OSZK-tezaurusz/Köztaurusz egy rendszert alkotnak. 69 A Taxaurusz (a taxonómiai tezaurusz) az élőlények, szervek és szövetek fogalmainak tezauruszcikkeit tartalmazza. Az OSZKÁR tezaurusz, az OSZKtezaurusz és a KÖZTAURUSZ kiegészítéseként használják.
69
Az OSZK Tezaurusz/Köztaurusz rendszere. URL: http://mek.oszk.hu/00700/00769/html/
INFORMÁCIÓKERESŐ NYELVEK II. A Geotaurusz és Geohisztaurusz a földrajzi és történelem-földrajzi kifejezések tezauruszcikkeit tartalmazza, és a földrajzi valamint a történelem-földrajzi helyek osztályozására és visszakeresésére használható az ókortól napjainkig. Megj.: a ma is alkalmazott rendszerek közül nagy szerepet játszik a Magyar pedagógiai tárgyszójegyzék, melyet az Országos Pedagógiai Könyvtár és Múzeumban használnak tárgyszavas indexelésre (a PRECIS indexelés kapcsán röviden ismertettük). A fejlesztések értékelése A tezauruszok többsége szaktezaurusz (megfelelve a tezaurusz funkciójával, lehetőségeivel kapcsolatos vélekedéseknek), általános az Osztaurusz, illetve az OSZK-tezaurusz/Köztaurusz. Az elkészült tezauruszok száma azt bizonyítja, hogy a szellemi előkészítő és alkotó munkában erősek voltunk, de az elkészült tezauruszok ésszerű alkalmazásának megszervezésében gondok voltak. A technikai feltételek (szoftverek) hiánya is gátolta az ésszerű, költséghatékony használat és feltétel lehetőségét. Az 1980-as éveket az „apály‖ jellemezte, nem lehetett fejlett számítógépes technológiához jutni. Az 1990-es években a rendszerváltást követően fokozatosan egyensúlyba került a szellemi és technikai összetevő, és kibontakozott az alkalmazásokhoz nélkülözhetetlenül szükséges együttműködés. A ma is használatos tezauruszokra a sokrétű alkalmazás lehetősége a jellemző, a fejlődés az egységes feldolgozási és keresési eljárások irányában halad. Az elkészült szaktezauruszok közül elsőnek az 1976 óta folyamatosan élő, fejlődő Könyvtári és tájékoztatási tezauruszt (KTT) mutatjuk be. Az OSZK-tezaurusz/Köztaurusz részletes bemutatására a 11. leckében kerül sor. 10.3.2 A Könyvtári és tájékoztatási tezaurusz (KTT) A tezaurusz fejlesztésének csomópontjai A Könyvtári és tájékoztatási tezauruszt az OSZK Könyvtártudományi és Módszertani Központ (OSZK KMK, ma OSZK Könyvtári Intézet) fejlesztette ki, azzal a céllal, hogy Könyvtártudományi szakkönyvtárba bekerülő dokumentumok feltárásához, azok szakrendi elhelyezéséhez, a Magyar Könyvtári Szakirodalom (MAKSZAB) anyagának tárgyi feltárásához hathatós segítséget nyújtson. Első kiadása (Könyvtári és tájékoztatási tárgyszójegyzék : tézaurusz-tervezet Szerk. Horváth Magda, Kövendi Dénes) 1976-ban jelent meg az OSZK KMK gondozásában, pótlása 1978-ban, 2. kiadása pedig 1987-ben. A 3. kiadásra 1992-ben került sor. 2000-től online tezaurusz formában is elérhető. A Könyvtári Intézet adatbázisának tárgyi feltárását segíti folyamatosan épített tezaurusza, mind a szakkönyvtár teljes anyagának, mind a magyar és nemzetközi könyvtár- és információtudományi cikkek vonatkozásában. A tezaurusz alkotóelemei A tezaurusz első kiadása még a „tárgyszójegyzék: tézaurusz tervezet‖ címet viselte. A fogalmak közötti összefüggések egyre gazdagabb kidolgozása után kezdte önállóan használni a tézaurusz elnevezést a 3. kiadásban. A MANCI adatbázisban való használat után nyerte el mai „tezaurusz” írásmódját. 135
INFORMÁCIÓKERESŐ NYELVEK II. 31. A tezaurusz főrésze és kiegészítő részei
Sorszám/Megnevezés (1) Főrész (2) Jelentéskörök szerinti rész (3) Hierarchikus rész (4) Permutált betűrendes rész (mutató) (5) Grafikus rész (6) Egyéb mutatók
Meghatározás a részletes deszkriptorcikkeket tartalmazza a deszkriptorokat fazetták (alkategóriák) szerint rendezve tartalmazza a deszkriptorokat hierarchikus rendszerben tartalmazza a lexikai egységeket – deszkriptorokat és nemdeszkriptorokat – egyetlen betűrendben tartalmazza, az összetett kifejezéseket permutáltan is bemutatja a lexikai egységek közötti relációkat grafikus módon ábrázolja az egyedi információk szintjén, ld. MAKSZAB
10.3.3 A tezaurusz főrésze A tezaurusz fő része a részletes deszkriptorcikkeket tartalmazza a vezérdeszkriptorral, a megjegyzésekkel, a szinonimákkal (és annak tekintett kváziszinonimákkal), valamint a deszkriptorok logikai kapcsolataival, és mindezek jelölésével. Megjegyzések, tárgyköri megjegyzések Megjegyzés: kezdetektől fogva jelen vannak a főrészben, a tárgyköri megjegyzést eleinte NB rövidítéssel jelölték, ami a Nota Bene latin szó rövidítése (szószerinti magyar jelentése: „Jól jegyezd meg!‖). A szinonimák és kváziszinonímák kezelése Az 1992. évi nyomtatott kiadásból származó deszkriptorcikk jelzi, hogy a megadott vezérdeszkriptor (FELDOLGOZÓ MUNKA) esetében annak minden lehetséges szinonimáját megadták. A H –jel [=helyett] alatt 5 olyan szinonimának tekintett kifejezés áll, melyek helyett a vezérdeszkriptort kell a fogalom reprezentálására használni.
INFORMÁCIÓKERESŐ NYELVEK II.
32. kép
Relációk ábrázolása a Könyvtári és tájékoztatási tezauruszban
A 2000. évtől működő adatbázisban a fenti jelölésrendszert egy felhasználóbarát jelölési mód váltotta fel. Ld. táblázatosan a vezérdeszkriptor és a szinonimák jelölését. 32. A szinonimák jelölési módja az adatbázisban
Jelölési mód Deszkriptor: Nemdeszkriptor:
Lexikai egységek Feldolgozó munka Állományfeltárás, Csoportos címleírás, Csoportos feldolgozás, Feldolgozás, Feltárás
Kvázi-szinonimák és jelölésük A szinonimarelációk a KTT-ben nem mindig csak az azonos jelentésű szavakra, kifejezésekre vonatkoznak. Megengedett, hogy – egy fogalom fajfogalmait a fogalom szinonimáinak tekintsük, pl. azért, mert azok az adott rendszerben viszonylag ritkán fordulnak elő, és így nem tartjuk fontosnak azok külön deszkriptorként való megjelenítését. Ezek a szinonimának tekintett kifejezések a kváziszinonimák („mintha‖szinonimák, „álszinonimák). Példa a kváziszinonimákra a KTT alapján: KÖZÉPISKOLAI KÖNYVTÁR H Gimnáziumi könyvtár Szakközépiskolai könyvtár Technikumi könyvtár Megj.: A kváziszinonimák is a „lásd‖ utalásnak felelnek meg 137
INFORMÁCIÓKERESŐ NYELVEK II. A KTT-re jellemző az is, hogy az objektumot és a műveletet olykor közös deszkriptor alá foglalja, pl. REFERÁTUM H Referálás A tezaurusz kidolgozói úgy döntöttek, hogy az objektumot (REFERÁTUM) használják a folyamat (Referálás) helyett is. Abból a feltételezésből indultak ki, hogy az a dokumentum, amely például a referálás művészetéről szól, tájékoztat a referátum funkcióiról, ismérveiről stb. is. Ily módon redundáns lenne, ha az objektumra, illetve a folyamatra különkülön deszkriptort használnánk akár az indexelésnél, akár a keresésnél. A logikai kapcsolatok és kezelésük A vezérdeszkriptornak a következő viszonykategóriáit fejezik ki: a) nemfogalmát (nemfogalmait), b) fajfogalmát (fajfogalmait), c) más meghatározott, vagy közelebbről meg nem határozott rokonsági fogalmait. Nem és fajfogalmak közötti kapcsolatok Egy fajfogalomnak több nemfogalma lehet Az alábbi példából látható, hogy a KTT-ben egy fajfogalom több nemfogalom alá is tartozhat. Így pl. az „egybehangolt állományalakítás‖ deszkriptornak a KTT-ben 3 nemfogalma is van: EGYBEHANGOLT ÁLLOMÁNYALAKÍTÁS F Állományalakítás F Együttműködés – belföldi F Együttműködés – külföldi Az „egybehangolt állományalakítás‖ egyaránt alárendeltje az állományalakításnak, a belföldi együttműködésnek, a külföldi együttműködésnek. A nem-faj összefüggések jelölése Az 1976. évi 1. kiadásban a kapcsolatjelek még latin nyelvi kifejezések rövidített változatai voltak. A 1992. évi kiadásban e jeleket felváltotta a széles körben használt, szabványban is ajánlott F, és A- jel, mely a fölérendeltség, alárendeltség jelölését vette át. 33. A nem-faj kapcsolatok jelölésének változása
nem és fajfogalom nem-, illetve fajfogalom jelölése
/ kiadás éve 1976 GE (Genus) SP (Species)
/ kiadás éve 1992 F (Fölérendelt) A (Alárendelt)
Egész-rész kapcsolatok és jelölésük változása Az 1976. évi kiadásban az egész-rész fogalom jelölésére még az EG (egész), ill. RÉ (rész) jelet használták, tehát külön kezelték. Az 1992. évi kiadásban már nem tüntették fel külön relációtípusként. Az „általánosabb csengésű‖ Fölérendelt – Alárendelt (F, A) relációpár része lett, hasonlóan a generikus (nem-faj) relációhoz. A nem-faj, illetve az egészrész kapcsolat jelölése összevonódott.
INFORMÁCIÓKERESŐ NYELVEK II. A rokonsági fogalom jelölése is megváltozott a KTT-ben, korábban RO volt, az 1992es kiadásban X lett. Tekintse meg a mellékelt deszkriptorcikkben az 1992. évi nyomtatott kiadást követően használt relációjeleket. A kapcsolatok aktuális jelölése a MANCI adatbázis tezauruszában A fenti absztrakt jelöléshez képest felhasználóbarát, közérthető módon jelölik a kapcsolatok típusát, szövegesen kiírva azokat az alábbiak szerint: a jelölt kapcsolat
kapcsolat jelölés 1992 nyomtatott kiadás H [helyett] F
Jelölés 2000-től a MANCI adatbázisban Nem-deszkriptor Tágabb
szinonima fölérendelt fogalom (nem-, illetve egészfogalom) alárendelt fogalom A Szűkebb (faj-, illetve részfogalom) egyéb rokon fogalmak R Rokon (lásd példán keresztül részletesen, konkrétan a következő fejezetben) 10.3.4 A tezaurusz kiegészítő részei A hierarchikus rész
A szakrendi rész a könyvtár- és információtudomány, a könyvtári és információs munka és kapcsolódó területek fogalmait rendszerezi. Numerikus felosztást alkalmaz. Az egyes könyvtári munkafolyamatok logikus sorrendben követik egymást, a részterületekre történő lebontásuk jól követhető. A szakrendi rész kifejlesztése során építettek a hierarchikus rendszer adta előnyökre (a rendezettség, a mélységbeli rugalmasság, áttekinthetőség, az alá- és fölérendeltségi összefüggések átláthatósága). A Könyvtári és tájékoztatási tezaurusz szakrendi részének alkalmazásai − (1) a Könyvtártudományi szakkönyvtárban található dokumentumok szabadpolcos elrendezése, − (2) a MAKSZAB – Magyar Könyvtári Szakirodalom Bibliográfiája kiadványban a tételek rendszerezésének az alapja − (3) A Könyvtári figyelő idegen nyelvű folyóirat-figyelő rovatban a tételek rendszerezésének az alapja. A permutált betűrendes rész A nyomtatott kiadásokban megjelenő permutált betűrendes rész egységes betűrendben tartalmazza a deszkriptorokat és a nem-deszkriptorokat.
139
INFORMÁCIÓKERESŐ NYELVEK II. Az alábbi funkciók teljesítését szolgálja. − a) betölti a sima betűrendes mutató funkcióját (elvezet a deszkriptorhoz), − b) segít a megfelelő deszkriptor megtalálásában akkor is, ha a kiinduló szó vagy kifejezés egy összetett deszkriptornak valamely utótagja, második, harmadik eleme csupán, tehát egy sima betűrendes részben kereshetetlen. − c) rendező funkciót tölt be a többtagú kifejezések permutációjával. A többtagú kifejezések (zömmel két-, és háromtagú kifejezések) esetén azok permutált (inverz, megfordított) változatait is tartalmazza. Egy-egy deszkriptor, ill. nem-deszkriptor annyiszor jelenik meg a permutált részben, ahány írásmódját ciklikusan permutálták. Két példát mutatunk be, a egyik a kéttagú, a másik háromtagú kifejezésekre vonatozik: Kéttagú kifejezések permutációja vállalati irodalom 50950 MŰSZAKI KISNYOMTATVÁNY 50895 irodalom – vállalati 50950 kisnyomtatvány – műszaki 50895 (Megj.: (1) a nagybetű azt jelenti, hogy deszkriptorról van szó. (2) Az ötjegyű számok a deszkriptor főrészen belüli sorszámát jelölik). Háromtagú kifejezések permutációi Dokumentálóképzés – egyetemi, főiskolai DOKUMENTÁLÓKÉPZÉS -FELSŐFOKÚ Egyetemi, főiskolai dokumentálóképzés Felsőfokú dokumentálóképzés Főiskolai dokumentálóképzés Képzés, dokumentáló-,egyetemi, főiskolai Képzés, dokumentáló – felsőfokú Tekintsük át a tezaurusz négy legfontosabb alkalmazását! − 1) MANCI adatbázis − 2) Országos Széchényi Könyvtár Könyvtártudományi és Módszertani Központ (OSZK KMK), mai nevén OSZK Könyvtári Intézet szakkönyvtára, − 3) Magyar Könyvtári Szakirodalom Bibliográfiája (MAKSZAB) − 4) Könyvtári Figyelő folyóirat éves mutatója. 10.3.5 A tezaurusz alkalmazása a MANCI adatbázisban A MANCI adatbázis szolgáltatásai A MANCI (Magyar és Nemzetközi Cikkek Irodalma) adatbázis a magyar könyvtár- és információtudományi periodikumok teljes körű, kurrens és folyamatos retrospektív feldolgozása alapján épül, a külföldi folyóiratokat pedig válogatva, 1986 óta dolgozza fel. Előállítója és forgalmazója az OSZK Könyvtári Intézet Szakkönyvtára. A tételek száma meghaladja a 40 000-et, mintegy 3000 tételnyi éves gyarapodással. Az adatbázist negyedévenként frissítik.
INFORMÁCIÓKERESŐ NYELVEK II. A MANCI adatbázis a Könyvtári és tájékoztatási tezauruszt használja a tárgyi-tartalmi feltárásra, melyet az adatbázisban a tezaurusz üzemmódban vehető igénybe. A MANCI adatbázis kezelője napjainkig a MikroISIS program volt. Az adatbázis 2000 februárjától lett elérhető online, valamint az OSZK belső hálózatán használható. A MANCI adatbázisban a kereshet a szerzők neve, kulcsszavak (konkrét személyek, intézmények, programnevek, könyvtárnevek stb.) és tárgyszavak (deszkriptorok) szerint. Ehhez kapcsolódik a tárgyország, nyelv, a megjelenés éve szerinti keresés lehetősége. A keresés szabályait naprakészen mutatja be az adatbázis súgója. 2007 után megjelenő cikkek feltárása már HUMANUS adatbázis keretében érhető el. A keresési, böngészési és tezaurusz-funkció A MANCI adatbázisban az alaposan kidolgozott és bevált három funkció közvetlenül a nyitólapról vehető igénybe (ld. mellékelt ábra)
33. kép
A keresési, böngészési és tezaurusz szolgáltatás a Manci adatbázisban
A MANCI adatbázist háromféle módon használhatja a felhasználó: Az egyszerű és összetett keresési funkció Egyszerű keresés funkcióval a következő adatelemek szerint kereshetünk: szerző, kulcsszó, tárgyszó (tezaurusz-deszkriptor) , megjelenési év , városnév, ország, régió, nyelv.
141
INFORMÁCIÓKERESŐ NYELVEK II. A keresés jól finomítható, ha egy-egy országot vagy nyelvet is megadunk (ezeket a negyedik és ötödik mezőből választhatjuk ki); kivétel Magyarország, ahol csak a nyelvet kell kiválasztani. Összetett keresés többféle szempont együttes használatával lehetséges. A böngészés funkció A Böngészés funkcióval két indexben böngészhetünk: az alapértelmezés szerint (Cikkek) a MANCI összesített mutatójában, ahol nagyon hatékonyan kereshetünk konkrét személyek, intézménynevek, könyvtárnevek stb. szerint, de természetesen tematikusan is. A Referátumok szerzői funkció kijelölésével a külföldi cikkek referálóinak névmutatójában is lehet böngészni. A tezaurusz funkció A tezaurusz funkció70 alkalmazásával a Könyvtártudományi tezaurusz deszkriptorai segítségével kereshetünk. A keresés menete: − (1) egy vagy több betű beírása és a tezaurusz ikonra való kattintás után belépünk a tezaurusz indexébe, − (2) rákattintunk a kívánt deszkriptorra, mire a program kikeresi és megjeleníti az ahhoz tartozó deszkriptorcikket, (az is lehet, hogy a keresett kifejezés beírásával (pl. feldolgozó munka) magához a deszkriptorcikkhez jutunk) − (3) kiválasztjuk a szükséges kifejezést, pl. feldolgozó munka az előtte levő zöld golyó ikonra kattintva – a program beírja a kiválasztott deszkriptort a keresőablakba. − (4) Ha több deszkriptort is kiválasztunk, a program azokat VAGY operátorral kapcsolja össze. − (5) A keresőablakban a kérdést tetszés szerint szerkeszthetjük, majd a Keresés gombra kattintva elindíthatjuk a keresést. A deszkriptorcikkek szerkezete és jelölései A deszkriptorcikkeket az áttekinthető szerkezet jellemzi. A két oszlopra bontott deszkriptorcikk bal oldali oszlopában a relációtípusok megnevezései, jobb oldali oszlopában pedig a konkrét deszkriptorok, ill. nem-deszkriptorok megnevezései láthatók. A relációk megnevezéseit szövegesen kiírják: − A szinonima jelölése: Nem-deszkriptor − A fölérendelt fogalom (nem-, egész-) jelölése: Tágabb − Az alárendelt fogalom (faj-, rész) jelölése: Szűkebb − Az egyéb rokon fogalmak jelölése: Rokon − Megj.: (1) a deszkriptorok előtt zöld golyó jelzi, hogy arra kell kattintani, ha keresni szeretnénk. (2) A deszkriptor ez esetben a vezérdeszkriptort jelenti)
70
MANCI adatbázis tezaurusz funkció. URL: http://w3.oszk.hu/ sugó manhtm/help.htm
INFORMÁCIÓKERESŐ NYELVEK II.
34. kép
A Feldolgozó munka deszkriptor a MANCI adatbázis tezaurusz részében
10.3.6 A KTT további alkalmazásai OSZK Könyvtártudományi szakkönyvtár Az OSZK Könyvtári Intézet szakkönyvtára az ország legnagyobb könyvtár- és információtudományi gyűjteménye. A KTT-et itt dolgozták ki és használják a beérkező dokumentumok tartalmi feldolgozására, és természetesen visszakeresésre, hiszen a könyvtárban terminálok állnak rendelkezésre a MANCI adatbázis „vallatására‖. A tezaurusz szakcsoportos részének ismerete előny, hiszen a dokumentumok azok rendjében böngészhető, kereshető a szabadpolcon. A szakkönyvtárban feldolgozott könyveket 1996 óta az OSZK NEKTÁR rendszerében, az OSZK-val közös katalógusban, a LibriVision-ben tárják fel. A Könyvtártudományi Szakkönyvtár online olvasói katalógusa [http://nektar.oszk.hu] címen érhető el. A katalógus hatékony használatát segíti a LibriVsion nyitóoldalán található „Kötelező olvasmány‖ tanulmányozása. A katalógusban a leíró adatokon kívül a KTT könyvtártudományi tárgyszavai és földrajzi tárgyszavak szerint is lehet keresni. A Könyvtártudományi Szakkönyvtárban az 1970-es években tértek át a dokumentumoknak a könyvtári és tájékoztatási tezaurusz szakrendje szerinti rendszerezésére a szabadpolcokon, illetve a beérkező dokumentumok feltárására. Ennek tárgyszavai alapján tárják fel a szakkönyvtári katalógusban a bekerülő dokumentumokat, valamint az általuk gondozott Magyar Könyvtári Szakirodalom Bibliográfiája (MAKSZAB) tételeit is. Magyar Könyvtári Szakirodalom Bibliográfiája (MAKSZAB) A MAKSZAB – szakbibliográfia- a magyar nemzeti bibliográfiai rendszer része. A Magyarországon megjelent könyvtár- és információtudományi szakirodalmat tárja fel, az OSZK KMK gondozásában, évente négyszer jelenik meg. Évente index egészíti ki.
143
INFORMÁCIÓKERESŐ NYELVEK II. A bibliográfia két részből áll: a főrészből és a mutatókból. A főrészben fontos rendszerző szerepet kap a Könyvtári és tájékoztatási tezaurusz szakrendje. Ez alapján tagolják a könyvtár-és információtudományi területeken (valamint határterületeken) a tárgyévben megjelent kiadványok bibliográfiai adatait, tárgyszavait, (deszkriptorait), valamint a Könyvtári Intézet Könyvtártudományi szakkönyvtárában meglevő dokumentumok raktári adatait. A MAKSZAB egymást kiegészítő mutatórendszere − a betűrendes mutató igen jól egészíti ki a tezaurusz szabályozott, átfogó, rendszerező funkcióit – azzal, hogy a konkrét nevek, személyek, intézmények, objektumok nevei (információs rendszer, hálózat, programtípus, géptípus konkrét nevei, Internet, OCLC, UBC, Microsoft Windows hálózat), konkrét konferencianevek, ismertetett periodikumok nevei, földrajzi nevek (pl. országnevek) finomkeresését lehetővé teszi. − a tárgyszómutató, a tezaurusz deszkriptorai segítségével teszi lehetővé a tartalmitárgyi feltárást és keresést. Az aktuális (éves) időszakban megjelent cikkeket stb. tükröző tárgyszavak, az országok, megyék neve és az utalók egységes betűrendben találhatók. A kiemelt tárgyszavak alatt az egyes tételek teljes tárgyszólánca szerepel (kivéve a kiemelt tárgyszót), a tárgyszólánc végén a bibliográfia tételszáma található. 34. Példa egy tétel főrészben, illetve betűrendes mutatóban való megjelenésére
Példa egy cikk tartalmának leírására Tétel megjelenése a főrészben 54364/00 A TORZSAI Tamás A kreditrendszerről – könyvtáros szemmel: tanácskozás az esztergomi Vitéz János Római Katolikus Főiskolán (Torzsai Tamás. – Bibliogr. == Kv. Kvt.könyvt. – 9.évf. 4.sz. (2000), 13-18. o. Konferencia – magyar Könyvtárosképzés – felsőfokú Tanterv, óraterv A tételben szereplő deszkriptorlánc permutált változatai a betűrendes tárgyszómutatóban: KONFERENCIA – MAGYAR Könyvtárosképzés – felsőfokú Tanterv, óraterv 54364/00 A KÖNYVTÁROSKÉPZÉS – FELSŐFOKÚ Konferencia -magyar Tanterv, óraterv 54364/00 A TANTERV, ÓRATERV Konferencia – magyar Könyvtárosképzés – felsőfokú 54364/00 A (*) Megj.: A dokumentumformát jelző kódok jelentése: A – folyóirat, M monográfia, P. periodikum, H – hírlapcikk, T- Tömegkommunikációs eszköz (rádió, televízió)
INFORMÁCIÓKERESŐ NYELVEK II. Könyvtári Figyelő A Könyvtári Figyelőhöz (melyet szintén az Országos Széchényi Könyvtár ad ki) minden évben egy éves index jelenik meg. Ebben a MAKSZAB-ban bemutatott elvekhez és szempontokhoz hasonlóan lehet keresni. A keresőrendszer három elemből áll: (1) tárgyszómutató (KTT tárgyszavai-deszkriptorai szerint), (2) a betűrendes mutató (szerzők stb. szerint), (3) valamint a folyóirat kumulált tartalomjegyzéke. A Könyvtári Figyelő fő rovatai a tanulmányok, recenziók, ismertetések, külföldi folyóirat-figyelő. A folyóirat szerkesztőségében folyik a könyvtárba beérkező gazdag külföldi könyvtár-és információtudományi szakirodalomból a referálásra való kijelölés, annak eldöntése, hogy mi jelenjen meg a Könyvtári Figyelő külföldi folyóiratszemléjében. Itt folyik a referált tételek ellátása deszkriptorokkal, annak érdekében, hogy egyrészt az éves indexekben, másrészt a MANCI adatbázisban kereshetők legyenek. A külföldi folyóiratfigyelő tematikus egységeinek tagolása a KTT szakrendszere szerint történik.
10.4
ÖSSZEFOGLALÁS
A lecke elején áttekintést kapott a mennyiségileg imponáló magyarországi tezauruszfejlesztésekről. Szellemi előkészítésben, végrehajtásban nem volt hiány, de a szervezésben, a hatékony, ésszerű alkalmazás megszervezésében igen. Az 1970-es évektől kidolgozott tezauruszok használat ideje szerinti elemzése olykor lehangoló, számos olyan van, amelyet kidolgoztak, de nem is használtak. Az élő rendszereket röviden áttekintettük. A 2. fejezettől az 1976 óta folyamatosan használt és fejlesztett Könyvtári és tájékoztatási tezaurusszal (KTT) ismerkedett meg részletesen. Megismerte a szabályozás területeit, a kapcsolatjelölési módok változásait (deszkriptorok, megjegyzések, szinonimák, logikai kapcsolatok vonatkozásában). Betekintést nyert az 1976 óta folyamatosan működő tezaurusz alkalmazásaiba (a Könyvtártudományi szakkönyvtárban a feltárás, dokumentumelrendezés eszköze, a Magyar Könyvtári Szakirodalom Bibliográfiájában (MAKSZAB), illetve a Könyvtári Figyelő külföldi folyóiratfigyelő rovatában az elrendezés és feltárás eszköze.
10.5
ÖNELLENŐRZŐ KÉRDÉSEK
1.
Tekintse át a magyarországi tezaurusz-fejlesztések fő állomásait!
2.
Értelmezze és értékelje a tezauruszok használati ideje szerinti adatait!
3.
Vegye számba a Könyvtári és tájékoztatási tezaurusz fejlődésének állomásait!
4.
Mutassa be a tezaurusz fő részét, a megjegyzések, szinonimák, és logikai kapcsolatok jelölésének módját!
5.
Fejtse ki véleményét a kapcsolatjelölők változásával kapcsolatban!
6.
Fejtse ki véleményét a permutált betűrendes résszel kapcsolatban!
7.
Miben látja a hierarchikus-szakrendi rész jelentőségét?
8.
Ismertesse a tezaurusz alkalmazási módját a MANCI adatbázisban!.
145
INFORMÁCIÓKERESŐ NYELVEK II. 9.
Adjon áttekintést a Könyvtári és tájékoztatási tezaurusz további alkalmazásairól!
10. Véleményezze a tezauruszt a leckében tanult ismeretek, illetve az adatbázisban
való keresés tapasztalatai alapján!
INFORMÁCIÓKERESŐ NYELVEK II.
11. AZ OSZK-TEZAURUSZ/KÖZTAURUSZ. NEMZETKÖZI TEZAURUSZOK
11.1
CÉLKITŰZÉS
A lecke áttanulmányozása után legyen képes − az OSZK-tezaurusz/Köztaurusz létrehozásával, fejlesztésével kapcsolatos ismeretek kifejtésére, − az OSZK-ban gondozott tezauruszok rendszerének kifejtésére, − a tezauruszba felvett kifejezések típusainak bemutatásra, − a tezauruszcikk szerkezetének ismertetésére deszkriptor és nem-deszkriptor esetében − az OSZK-tezaurusz/Köztaurusz alkalmazásának bemutatására, − a Köztaurusz szerinti keresési, böngészési módszerek bemutatására, − a weben megjelenő nemzetközi tezauruszok jellemző vonásainak értékelésére, − az ERIC tezaurusz értékelésére (a félév során szerzett tapasztalatokra is építve), − az UNESCO tezaurusz bemutatására (saját keresési tapasztalatokra is utalva), − a magyarországi tezaurusz-fejlesztések és alkalmazások sajátos eredményeinek bemutatására, − a nemzetközi fejlesztések távlati irányainak és lehetőségeinek kifejtésére.
11.2 1. – – 2. – – 3. – 4. – – – – 5. – – 6. 7. –
TARTALOM Az OSZK-tezaurusz/Köztaurusz létrehozása és rendszere A tezaurusz jellemző ismérvei Az OSZK tezauruszok rendszere A lexikai egységek kategóriák szerinti bemutatása A tezauruszba felvett kifejezések típusai A tezaurusz lexikai egységei A tezauruszcikkek és szerkezetük Az összefüggések körének bemutatása Az OSZK-tezaurusz/Köztaurusz alkalmazásai Az OSZK tezaurusz és Köztaurusz összefüggései A Köztaurusz alkalmazás és feltételei Az alkalmazásokat segítő segédeszközök A Köztaurusz HunTéka-Monguz alkalmazási példája Nemzetközi tezauruszok Áttekintésük Technikai ismérveik ERIC tezaurusz UNESCO tezaurusz A tezaurusz részei 147
INFORMÁCIÓKERESŐ NYELVEK II. – Keresés az UNESCO online katalógusában 8. Magyar fejlesztési eredmények és távlatok – Sikeres tezaurusz alkalmazások – Tezaurusz – ETO-alkalmazások – Tezaurusz szerinti keresés, böngészés a MOKKA-ban 9. Nemzetközi távlatok és ösztönzések – A fogalmi kategóriák és a bibliográfiai entitások összeegyeztetése – Keresőnyelvi rendszerek komplex alkalmazási példája
11.3
A TANANYAG KIFEJTÉSE
11.3.1 Az OSZK tezaurusz/Köztaurusz létrehozása és rendszere A tezaurusz jellemző ismérvei A leckében szólunk a tezaurusz szabványhoz való viszonyulásáról, a tezaurusz HUNMARC formátumáról, a tezaurusz következetes alkalmazását támogató eszközökről, és magának az alkalmazásnak a lehetőségéről és módjáról. Az Országos Széchényi Könyvtár tezaurusza (OSZK Tezaurusz, 2000) az ISO 2788-86 nemzetközi és az MSZ 3418-87 magyar tezaurusz-szabványoknak megfelelően készült az Országos Széchényi Könyvtár Fejlesztési osztályán. Az OSZK-tezaurusz/Köztaurusz az OSZK és a közművelődési könyvtárak gyűjtőkörének vonatkozásában „általános‖ (adott gyűjtőkörre értelmezve „általános‖). A tezaurusz „általános/egyetemes‖ a szókincset illetően, de nem általánosan/egyetemesen‖ használható. Az „általános‖ jelző nem azt jelenti, hogy gyűjtőkörtől függetlenül mindenütt alkalmazható, mert ilyen természetes nyelvű információkereső-nyelvi (azaz szabványosított) szótár megvalósíthatatlan lenne. Az OSZK-tezaurusz hosszú évek munkájával 2000-ben készült el, Ungváry Rudolf vezetésével, számos szakember közreműködésével, egy erre a célra kidolgozott tezauruszkezelő programra támaszkodva. A tezauruszkezelő program neve RELEX, mellyel a HUNMARC szerkezet is alkalmazható, s megvalósítható az adatcsere-formátum segítségével az adatok exportja és importja. A felhasználók számára a mindig legfrissebb kereshető változat az OSZK Könyvtári Intézet honlapján férhető hozzá.71 Az OSZK tezauruszok rendszere AZ OSZK-tezaurusz/Köztaurusz az Országos Széchényi Könyvtárban és a közművelődési könyvtárakban a dokumentumok tartalmi feltárásához és kereséséhez használható. A Taxaurusz és a Geotaurusz és Geohistaurusz az OSZK-tezaurusz/Köztaurusz egy rendszert alkotnak. 72
71 72
OSZK Tezaurusz/Köztaurusz. Kereshető adatbázis. URL: http://mek.oszk.hu/adatbazis/thes.htm Az OSZK Tezaurusz/Köztaurusz rendszere. URL: http://mek.oszk.hu/00700/00769/html/
INFORMÁCIÓKERESŐ NYELVEK II. Az OSZK-tezaurusz/Köztaurusz a társadalom-, és természettudományok fogalmait tartalmazó része a rendszernek, a szakkifejezéseket, kapcsolataikat, valamint a formai (dokumentumtípus-) kifejezéseket tartalmazza. A Taxaurusz (a taxonómiai tezaurusz) az élőlények, szervek és szövetek fogalmainak tezauruszcikkeit tartalmazza. A Geotaurusz és Geohisztaurusz a földrajzi és történelem-földrajzi kifejezések tezauruszcikkeit tartalmazza, és a földrajzi valamint a történelem-földrajzi helyek osztályozására és visszakeresésére használható az ókortól napjainkig. Az OSZK Tezaurusz/Köztaurusz rendszer lexikai állománya megközelíti az 50 000-et (a kereshető változat 2010. szeptemberi frissítése bevezetője szerint). A rendszer részletes bemutatása az interneten elérhető73 11.3.2 A lexikai egységek kategóriák szerinti bemutatása A tezauruszba fölvett kifejezések típusai A tezauruszba a teljesség igénye nélkül felvették mindazokat a fontosabb kifejezéseket, melyekre az OSZK-ban, ill. a közművelődési könyvtárakban a dokumentumok átfogó osztályozása és a tartalmukra vonatkozó keresőkérdések megfogalmazása érdekében szükség lehet. A kifejezéseket – néhány kivételtől eltekintve – névszói formában és egyes számban vettük fel. Az OSZK-tezaurusz/Köztauruszban feltüntetik a legfontosabb fogalmi összefüggéseket; ezeknek az összefüggéseknek a segítségével a felhasználó tájékozódhat a kiválasztott kifejezéshez közel álló, további osztályozásra használható kifejezésekről, hogy a dokumentum tartalmát, illetve kérdését a legjobb formában fogalmazhassa meg. Az OSZK-tezaurusz/Köztauruszban szereplő összefüggések részletesebbek, mint azok a „lásd‖ és „lásd még‖ utalások, melyek a hagyományos tárgyszójegyzékekben találhatók. Így pontosabban megállapítható belőlük az összefüggés fajtája, tartalma, ill. minden összefüggésnek a fordítottja is szerepel a tezauruszban (ld. bővebben Tezauruszcikkek és szerkezetük fejezetben). A tezaurusz lexikai egységei 35. A tezaurusz szavai : a lexikai egységek típusai
a lexikai egységek kategóriái szakkifejezések ismeretterületek, tudományok, tevékenységek 73
azokhoz tartozó konkrét lexikai egységek Anarchizmus, Adatátvitel, Árvíz, Államigazgatás, Weblap); Adóügy, Algebra, Egészségügy, Hőtechnika Ablaktisztítás, Bevásárlás, Közlekedés, Kukkolás, Rablás);
OSZK TEZAURUSZ/KÖZTARUSZ. Az Országos Széchényi Könyvtár és a Közművelődési könyvtárak átfogó tezaurusza. 3.0 változat. Főszerkesztő: UNGVÁRY Rudolf. Budapest, Magyar Könyvtárosok Egyesülete, Országos Széchenyi Könyvtár. 2002. december 31. URL: http://mek.oszk.hu/00700/00769/html/
149
INFORMÁCIÓKERESŐ NYELVEK II. a lexikai egységek azokhoz tartozó konkrét lexikai egységek kategóriái termékek, anyagok, tárgyak, Acéláru, Csomagolóeszköz, Darugép, Élelmiszer, Gipsz, gépek, berendezések Jármű, Ruházat, Vas-műszaki cikk növények, állatok Baktérium, Élvezeti növény, Embrió, Gyümölcs, Kutya, Szarvas, [e kifejezések a TAXAURUSZ-ban szerepelnek]; szervek, szervrendszerek Agyhártya, Bél, Emésztőrendszer, Izom, Szív, Testrész, Vese) [e kifejezések a TAXAURUSZ-ban szerepelnek]; intézmények, testületek Alkoholelvonó, Bíróság, Egyéni vállalkozás, Egyházi hivatal, Gimnázium, Rendőrség, Ügyészség, Vásárcsarnok üzletek, boltok, Autósbolt, Éttermek, Kaszinó vendéglátóipari országnevek, földrajzi neEger, Európa, Fejlődő ország, Erdély [ezek a kifejezések a vek, történelmi földrajzi GEOTAURUSZ ÉS GEOHISTAURUSZ-ban szerepelnevek nek]; nép-népcsoport (nemzetiMagyar, Székely, Német, Zsidóság) [ezek a kifejezések a ség-) nevek GEOTAURUSZ ÉS GEOHISTAURUSZ-ban szerepelnek]; időt, kort, korszakot jelentő Kiegyezés kora, Legújabbkor, Mohácsi vész, Reneszánsz, kifejezések Világháború (1939-1945) formai kifejezések Bélyeg, Dokumentumfilm, Grafika, Himnusz, Kabaré, Mozijegy, Regény, Színlap, Vicc, Zenemű 11.3.3 A tezauruszcikkek és szerkezetük A tezauruszcikk A tezaurusz betűrendes részében deszkriptor- és nemdeszkriptor-cikkek egyaránt szerepelnek az egységes betűrendben. Vezérszói helyzetben – azaz a tezauruszcikk élén – minden szó a betűrendnek megfelelő helyen jelenik meg. Tehát a vezérszó lehet mind deszkriptor, mind pedig nemdeszkriptor. Az alábbiakban egy példán keresztül mutatjuk be, hogyan épül fel egy tezauruszcikk: a KISEBBSÉGI KÉRDÉS deszkriptorának példája: ld. mellékletben: KISEBBSÉGI KÉRDÉS HV
Nyelvhasználat
vezérszó a vezérszóhoz kapcsolódó lexikai egységek „lásd vagylagosan‖ reláció
A Nemzetiségi kérdés
Szűkebb, speciálisabb jelentésű fogalom
T Politika
Tágabb fogalom (a vezérszóval szemben az egészet jelöli)
Kisebbség P Nemzetiségi szervezet R Konfliktus X Autonómia
Részfogalom (a vezérszóval szemben, mely z egészet jelöli) Ok-okozata kapcsolat (a kisebbségi kérdés okozat lehet a konfliktus)
INFORMÁCIÓKERESŐ NYELVEK II. Függetlenségi mozgalom Kitelepítés A vezérszóval egyéb, a tezauruszban lényeKollektív jogok gesnek tekintett rokonsági kapcsolat Nacionalizmus Politikai mozgalom Szórványmagyarság 35. kép A Kisebbségi kérdés deszkriptor relációi Ez egy másik ábrázolása: 74 36. Nemdeszkriptor vezérszói helyzetben:
Nemdeszkriptor vezérszói helyzetben való használata Nyelvhasználat < nemdeszkriptor vezérszói helyzetben Nyelvhasználat a vezérszóhoz kapcsolódó lexikai egységek LV < Nyelvészet „lásd vagylagosan‖ reláció A fenti példákból látható, hogy a tezauruszcikk betűrendi helyét a cikk élén álló, balra kiugró vezérszó határozza meg. (1) A deszkriptorok a tezauruszcikkek élén (vezérszói helyzetben) NAGYBETŰKKEL iródtak. (2) A nemdeszkriptorok a tezauruszcikkek élén (vezérszói helyzetben) nagy kezdőbetűvel és kisbetűkkel íródtak. (a nemdeszkriptorok a deszkriptorok szinonimái vagy szinonímiának tekintett (ún. kváziszinonim) kifejezései.) (Megj. A nyilak, illetve a magyarázatok csak didaktikai céllal készültek. ) Az összefüggések körének bemutatása A vezérdeszkriptor logikai kapcsolatai A vezérszó (vezérdeszkriptor) kapcsolatait az OSZK-tezaurusz/Köztauruszban való szabványos, ill. felhasználóbarát jelölését a 9. leckében, a vezérdeszkriptor kapcsolatainak jelölésénél példaként hoztuk. (Ld. részletesen ott!) A deszkriptorok közötti kapcsolatokat a tezaurusz igen gazdagon, árnyaltan tünteti fel. Generikus (nem-faj) kapcsolat – fölé – és alárendelt kapcsolatok Partitív (egész-rész) kapcsolatok Ok-okozati összefüggés Eszköz-rendeltetés kapcsolat tevékenység és tevékenység között Eszköz-rendeltetés kapcsolatos tudomány és tevékenységi kör között Előfeltétel/kiindulás – rezultáns/következés kapcsolatok Rokonsági (egyéb) kapcsolatok
74
UNGVÁRY Rudolf: Strukturált információkereső-nyelvi szótárak (tezauruszok) : magyarországi helyzetkép, lehetőségek, fejlesztési nehézségek. URL:
http://dsd.sztaki.hu/conferences/infrastruktura/eloadasok/ungvary/ungvary.doc
151
INFORMÁCIÓKERESŐ NYELVEK II. A megjegyzések Számos bizonytalan alkalmazású társadalomtudományi (népnévi, történelmi stb.) kifejezés esetében már a tezaurusz készítése során szükségesnek látszott megjegyzés megszövegezése. A HUNMARC formátum számos más megjegyzéstípust tartalmaz, melyeket a tezaurusz-ismertetőben táblázatosan összefoglalnak, pl. 670 Megjegyzés a besorolási adat forrásáról stb. Amikor a vezérszó nem deszkriptor 37. A szinonimák és kváziszinonimák kezelése
Szinonima és kváziszinonima kapcsolatok Az alkotmányosság kitüntetett szinonimája vagy kváziszinonimája a jogállam Az erkölcsi kopás Kitüntetett kváziszinonimái együttesen az Értékcsökkenés és a Kopás A „Folklór‖ kitüntetett kváziszinonim kifejezése vagy a „Folklorisztika‖, vagy a „Népművészet‖, vagy a „Néprajz‖.
Jel
Jelentés
L
= Lásd szinonimáját
L&
LV
= Lásd még
= Lásd vagy
Példa Alkotmányosság L Jogállam Erkölcsi kopás L& Értékcsökkenés Kopás Folklór LV Folklorisztika Népművészet Néprajz
11.3.4 OSZK-tezaurusz/Köztaurusz alkalmazásai Az OSZK-tezaurusz és a Köztaurusz összefüggései A tezaurusz használata néhány közművelődési könyvtárban és az Országos Széchényi Könyvtárban megkezdődött, de az átállás a meglevő keresőnyelvekről – mint lenni szokott – körülményes dolog és időt vesz igénybe. A közművelődési könyvtárak igényeinek kielégítésére az OSZK-tezauruszt Köztaurusz címen adaptálták. Ennek induló változata az OSZK (Ungváry Rudolf) szakmai irányításával a Kaposvári Megyei Könyvtár szervezésében született meg 2001 márciusában. A Köztaurusz együttműködő karbantartási és fejlesztési felülete a matriksz.hu honlapján elérhető az Interneten. A sok munka megtérülni látszik. Kialakultak egyes mintaalkalmazások (pl. Kaposvárott, Győrött). A KÖZTAURUSZ alkalmazás és feltételei A tezaurusz következetes alkalmazását megfelelő eszközök támogatják, lehetővé téve az általános tárgyszójegyzékként való alkalmazás különféle módozatait. A RELEX segítségével a Tezaurusz HUNMARC formátumban exportálható (ez a formátum megegyezik a
INFORMÁCIÓKERESŐ NYELVEK II. USMARC formátumával). E formátum alapján vehető át az egyes könyvtári adatbázisrendszerekbe, miután azokat felkészítik a besorolási adatok adatcsere-formátumára. A szabványos tezauruszcikk a RELEX segítségével vagy egyszerű WORD csereműveletekkel leegyszerűsíthető. Az alábbi táblázat az Asszimiláció deszkriptorcikkét és tárgyszójegyzékben megjelenő változatát mutatja. Akinek bonyolult a deszkriptorcikk, az választhatja a tárgyszócikket, kétfajta kapcsolattal, vagy ha az is sok, akkor megtarthatja csak a „Lásd még‖ utalásokat. 38. A tezaurusz általános tárgyszójegyzékként való alkalmazása
Deszkriptorcikk: ASSZIMILÁCIÓ M: Hozzáidomulás, beolvadás, beépülés más országba, népbe, társadalmi csoportba; nyelvi váltás HV Beolvadás T Nemzetiségi kérdés X Emberi jog Kétnyelvűség Migráció Nemzetiség = Anyagcsere Növényi asszimiláció
Tárgyszócikk: (1. változat) ASSZIMILÁCIÓ Lásd még Emberi jog Kétnyelvűség Migráció Nemzetiség Nemzetiségi kérdés Homonimája: Anyagcsere Növényi asszimiláció
Tárgyszócikk (2. változat) ASSZIMILÁCIÓ Lásd még Emberi jog Kétnyelvűség Migráció Nemzetiség Nemzetiségi kérdés
Az alkalmazásokat segítő segédeszközök Köztaurusszal kapcsolatosak: 75 Köztaurusz alkalmazási és karbantartási szabályzat: 1.0 változat ( [összeáll. Ungváry Rudolf] [közr. a] Magyar Könyvtárosok Egyesülete. – Budapest : MKE, 2000. – 29 p. Osztályozási példatár : a Köztaurusszal végzett osztályozás példái és megoldásai : 1.0 változat ( [összeáll. Ungváry Rudolf] [közr. a] Magyar Könyvtárosok Egyesülete. – Budapest : MKE, 2000. – 45 p. OSZK-tezauruszokkal kapcsolatosak: Az OSZK tezaurusz alkalmazási és karbantartási szabályzat : 1.0 változat ( [összeáll. Ungváry Rudolf] [közr. az] Országos Széchényi Könyvtár. – Budapest : OSZK, 2000. – 29 p. Osztályozási példatár : Az OSZK TEZAURUSZ/KÖZTAURUSSZAL végzett osztályozás példái és megoldásai : 2.1 változat / [összeáll. Ungváry Rudolf] ; [közr. a] Magyar Könyvtárosok Egyesülete és az Országos Széchényi Könyvtár. – Budapest :MKE, OSZK, 2002. – 57 p. Tezaurusz szerkesztő és karbantartó programrendszer: RELEX AB : Tezauruszok, szótárak, mutatók szerkesztését támogató program lexikai egységek formájának és relációinak 75
OSZK Tezaurusz/Köztaurusz alkalmazásokat segítő eszközök URL: http://mek.oszk.hu/00700/00769/html/
153
INFORMÁCIÓKERESŐ NYELVEK II. ellenőrzésére : Felhasználói kézikönyv : 1.1 változat / Ungváry András és Ungváry Rudolf]. – Budapest : Ariel Studió Bt., 2001. – 75 p. A Köztaurusz HunTéka-Monguz alkalmazási példája A Köztaurusz alapján történő tárgyi feltárás bevezetéshez elengedhetetlen a könyvtárosok és a szoftverfejlesztők közötti szoros együttműködés, ezt követően a szoftverfejlesztés végrehajtása, amelyhez anyagi eszközök is szükségesek. Gáncsné Nagy Erzsébet és Lengyel Mónika a többéves úttörő fejlesztő munka gondjait és örömeit foglalta össze.76 A győri Kisfaludy Károly Megyei Könyvtárban több év kísérletezései után 2004-ben értek be a sikeres tezaurusz alkalmazás feltételei. Pályázat útján megteremtődött az anyagi háttér a szükséges új integrált könyvtári szoftver beszerzésére. A pályázat értékelésénél az alkalmazás fontos érve az is, hogy létezik egy, a weben hozzáférhető karbantartó felület, melyen keresztül lehetőség van módosítás, illetve kiegészítés kérésére, arra, hogy a szerkesztett szótár a könyvtár igényeinek figyelembevételével fejlődjön, alakuljon. A pályázatot a HunTéka könyvtári rendszer nyerte el, melynek kifejlesztett OPAC felülete lehetővé teszi a több szempont szerinti keresést, illetve böngészést. A szoftver fejlesztői lehetővé tették, hogy a könyvtárosok számára a Huntéka adatbeviteli felületén rendelkezésre álljon a Köztaurusz teljes kínálata, teljes kapcsolatrendszere, amelyből a használni kívánt deszkriptort átemelhetik az adott dokumentumhoz. A használók olyan élő, bibliográfiai rekordhoz kapcsolt online tárgyszavas mutatót vehetnek igénybe, ahol a KÖZTAURUSZ lexikai egysége esetén megjelenik hozzá tartozó tezauruszcikk is. Ha pl. tezaurusz kifejezés szerint böngészünk, a labdarúgás tezaurusz-kifejezés bevitele után megjelennek annak szinonima és fogalmi kapcsolatai. (ld. a táblázatban). Figyeljük meg a táblázatban a jelölési módokat. A szinonimák kurzívan szerepelnek, a deszkriptorok után zárójelben szerepel a kapcsolat típusa. 39. táblázat: a fogalmi kapcsolatok megjelenítése böngésző üzemmódban
76
figyelemfelhívás Kapcsolódó fogalom: Kapcsolódó fogalom:
a kapcsolatok konkrét megadása futball teremlabdarúgás
Kapcsolódó fogalom: Kapcsolódó fogalom: Kapcsolódó fogalom: Kapcsolódó fogalom: Kapcsolódó fogalom: Kapcsolódó fogalom: Kapcsolódó fogalom: Kapcsolódó fogalom:
csapatsport (Fölérendelt (F)) labdajáték lábbal (Fölérendelt (F)) szurkoló (Eszköz (E)) futballhuliganizmus (Lásd még (X)) játékvezető (Lásd még (X)) labdarúgó (Lásd még (X)) labdarúgópálya (Lásd még (X)) rögbi (Lásd még (X))
GÁNCSNÉ NAGY Erzsébet, LENGYEL Monika: Következetes tartalmi feltárás szoftvercsere mellett? A KÖZTAURUSZ használata a győri Kisfaludy Károly Megyei Könyvtárban = Tudományos és Műszaki Tájékoztatás, 53. évf. (2006) 7-8. sz. URL: http://tmt.omikk.bme.hu/show_news.html?id=4493&issue_id=474
INFORMÁCIÓKERESŐ NYELVEK II. A fogalmi kapcsolatok áttekintése után a kiválasztott tezaurusz-kifejezésre kattintva, megjelennek a találatok, amelyek leírásait a megfelelő formátumban be lehet hozni, tanulmányozni, a tétel hozzáférhetőségéről információt szerezni. 11.3.5 Nemzetközi tezauruszok Áttekintésük A nemzetközi online tezauruszok számos formában elérhetők. American Society for Indexing (ASI)77 (az indexelés, referálás és adatbázis-építés elméleti, módszertani fejlesztésének, és alkalmazásainak nagyhatású tudományos társasága). Weblapján rövid ismertetéssel ellátva összegyűjti a legfontosabb online tezauruszok linkjeit, és ily módon közvetlenül elérhetővé teszi azokat. (Megj.: Ahogy arra a kurzusunk elején utaltunk, fontos az authority rekordok szerepe is, ezek alapos megismerésére ad módot a tudományos társaság linkgyűjteményének második része). Érdemes az online tezauruszok közül minél többet kipróbálni, hogy tapasztalatokra tegyen szert a használatukban.
36. kép
77
Tezauruszok és authority fájlok az interneten
URL: http://www.asindexing.org/site/thesonet.shtml
155
INFORMÁCIÓKERESŐ NYELVEK II. Technikai ismérveik A webes tezauruszoknak számos technikai változata alakult ki a fejlődés során. – egyszerű statikus szöveges formátumú tezauruszok, – statikus (hipercsatolásokat nem alkalmazó) HTML-formátumú tezauruszok, – dinamikus (navigálható hipercsatolásokat alkalmazó) HTML-formátumú tezauruszok (MeSH), – fejlett vizuális és grafikus interfészeket használó tezauruszok (Plumb Design Visual Thesaurus, újabban Thinkmap Visual Thesaurus http://www.visualthesaurus.com/index.jsp), – XML-formátumú tezauruszok 11.3.6 ERIC Thesaurus A tantárgy oktatásában az itt találhatók közül eddig az ERIC tezaurusszal foglalkoztunk a 2. lecke keretében (2.3.4). Az ERIC web portáljának tezauruszában78 az elektronikus tanulás – Electronic Learning- deszkriptorcikkét79, elemeztük részletesen. A tezaurusztételben (deszkriptorcikkben) található adatok típusai meggyőzően mutatják az ERIC tezaurusz alapos kidolgozottságát, célirányos alkalmazását. Az adatok köre magában foglalja a következőket: rekordtípus, megjegyzés, kategória, fölérendelt fogalom, alárendelt fogalom, további kapcsolódó fogalmak, szinonimák, a tezaurusztétel megjelenési dátuma, illetve azonosítószáma. A linket felkeresve „felfedezéses keresésre‖ nyílik lehetősége, a keresést a megadott deszkriptor-kapcsolatok bármelyikének csatolóival folytathatja. A tezaurusztétel megismerése mellett érdemes betekintést nyerni abba, hogy az ERIC bibliográfiai rekordokban milyen mélységben történik a deszkriptorok szerinti feltárás. Ennek érdekében keresse fel az ERIC adatbázist, és keressen rá az Electronic learning deszkriptorra. Az ASI honlapja segítségével érdemes más tezauruszokkal is megismerkedni. A továbbiakban az UNESCO tezaurusz használatához nyújtunk előzetes információkat. 11.3.7 UNESCO tezaurusz Az UNESCO tezaurusz80az Egyesült Nemzetek oktatási, tudományos és kulturális szervezetének a tezaurusza. Feladata a szervezet céljainak megfelelően feltárni a fejlődést szolgáló dokumentumokat, a mintaalkalmazásokat. 7000 deszkriptort tartalmaz angol és orosz nyelven, 8600-at francia és spanyol nyelven. Főrészből, permutált betűrendes részből és hierarchikus részből áll. A deszkriptorcikkekhez három úton is eljuthatunk. (a) betűrendes részben való kereséssel – search for alphabetic display (b) permutált betűrendes listában való böngészés – index to display the permuted list (c) a hierarchikus rész használatán keresztül, fogalmi szinteken át való böngészéssel 78
ERIC Educational Resources Information Center Web Portal. Thesaurus. URL: http://www.eric.ed.gov/ERICWebPortal/thesaurus/thesaurus.jsp 79 ERIC Thesaurus Web portal. URL: http://www.eric.ed.gov/ERICWebPortal/gotoThesaurusDetail.do?term=Electronic+Learning 80 UNESCO Thesaurus URL: http://databases.unesco.org/thesaurus/
INFORMÁCIÓKERESŐ NYELVEK II. A tezaurusz részei Főrész, deszkriptorcikkek, az összefüggések jelölése Akármelyik úton jutunk is el a kívánt deszkriptorhoz, ugyanabban a szerkezetben találjuk azt, megadva a kapcsolatait, sőt zárójelben a találatok számát is megkapjuk. Deszkriptor vezérszói helyzetben A deszkriptorcikk az alábbi elemeket tartalmazza − a deszkriptor francia, spanyol és orosz megnevezései, megjegyzés (scope note, SN), − annak a mikrotezaurusz jelzetnek (MT) a száma, amely alá a deszkriptor tartozik, − a szinonimák (UF, Used for), − a kapcsolódó nemfogalmak – tágabb fogalmak (BT, Broader terms), ha van − a kapcsolódó fajfogalmak – szűkebb fogalmak (NT, Narrower terms), − a kapcsolódó egyéb fogalmak, rokon fogalmak (RT, Related terms). 40. Az Academic achievement (tanulmányi teljesítmény) deszkriptorcikk
Deszkriptorcikk Academic achievement [1016] Terme français: Rendement scolaire Término español: Rendimiento escolar Русский термин : Академическая успеваемость MT 1.65 Educational evaluation UF Academic performance UF Student achievement UF Student progress NT Academic failure [128] ....NT2 Dropping out [131] ....NT2 Grade repetition [85] RT Academic standards [190] RT Achievement tests [112] RT Educational psychology [642] RT Student evaluation [700] RT Teacher effectiveness [261]
Magyarázatok Academic achievement (tanulmányi teljesítmény) 1016 találat Francia megnevezés Spanyol megnevezés Orosz megnevezés Az 1 Oktatatáson belül az 1.65 oktatásértékelés mikrotezaurusz Szinonima Szinonima Szinonima Alárendelt fogalom 128 találat Alárendelt fogalom 2. szint Alárendelt fogalom 2. szint Rokon fogalom Rokon fogalom Rokon fogalom Rokon fogalom Rokon fogalom
Figyelje meg a táblázatban a deszkriptor alatt megjelenő kapcsolatok sorrendjét UF=Used for jel után a szinonimák NT1 Academic failure [kudarc], alatta második szinten NT2 szinten a Dropping out [kibukás, kiesés], Grade repetion [ismétlés]… 157
INFORMÁCIÓKERESŐ NYELVEK II. NT (=Narrower terms - „szűkebb‖, alárendelt fogalmak) A példában szereplő deszkriptor 1.65 Educational evaluation Nem-deszkriptorcikk A nem-deszkriptort vezérszói helyzetben a USE (használja helyette kifejezés), majd a megfelelő deszkriptor megnevezése követi, pl. Equal education USE Universal education Betűrendes keresés A betűrendes rész is a tezaurusz kezdőlapjáról érhető el, a search for alphabetical display parancsszóra, onnan választhatók ki a megfelelő deszkriptorcikk. (pl. a fenti deszkriptor).81 Hierarchikus rész Az UNESCO tezaurusz hierarchikus részét akkor használjuk, ha nem tudjuk pontosan a deszkriptor megnevezését, és logikai úton közelítjük meg. Első lépés a 7 átfogó tárgykör (subject field, vagy más néven domain) egyikének kiválasztása: 1 Education, 2 Science, 3 Culture, 4 Social and human sciences, 5 Information and communication 6 Politics, law and economics, 7 Countries and country groupings Második lépés, a kiválasztott tárgykörön belül további számjegyek hozzáadásával láthatók a lebontott ún. mikrotezauruszok [MT], Ezek közül kell kiválasztani a megfelelőt. Ha pl. az oktatásértékelésre vagyunk kíváncsiak, akkor az 1 Education tárgykörön belül az 1.65 –öt, melynek témája Educational evaluation, azaz oktatásértékelés. A kiválasztott 1.65. mikrotezauruszra kattintva bejönnek az ahhoz tartozó deszkriptorok deszkriptorcikkei. Az 1.65-ön (Educational evaluation) MT-n belül 4 ilyen deszkriptorcikk található (Academic achievement, educational evaluation, Educational qualifications, Educational quality) Ezek közül az elsőnek megjelenő Academic achievement [felsőoktatási teljesítmény] mutatjuk be a táblázatban. 41. A 1.65. Mikrotezauruszon belüli deszkriptorcikkek példája
MT 1.65 Educational evaluation -mikrotezaurusz csúcsfogalom Academic achievement UF Academic performance UF Student achievement UF Student progress NT1 Academic failure [128] ....NT2 Dropping out [131] ....NT2 Grade repetition [85]
81
Magyarázat a példához
Itt az alárendelés két szintben megy végbe
UNESCO Thesaurus Databases. URL: http://databases.unesco.org/thesaurus/
INFORMÁCIÓKERESŐ NYELVEK II. Permutált betűrendes rész használata Angol megnevezése: Alphabetical display, szószerint betűrendes megjelenítés. A deszkriptorokat, illetve nem deszkriptorokat permutált betűrendes listában jeleníti meg. Az összetett kifejezések bármelyik tagja szerint lehet keresni, pl. az Intangible cultural heritage háromtagú összetett szó mindig előkerül, bármelyik tagját is írjuk be kereséshez. A permutáció lehetővé teszi, hogy a cultural szóra keresve minden olyan deszkriptort megtalálhassunk, amelynek megnevezésében a keresett szó az összetett kifejezések bármely részében megtalálható. A példánkban szereplő Academic achievement is könnyen előjön a permutált mutatóban, akár Academic-et, vagy achievement-et írunk be. Keresés az UNESCO online katalógusában A fenti módokon (betűrendes, permutált betűrendes, vagy hierarchikus részt használva) a kapott deszkriptortételben minden fogalmi kapcsolatnál szerepelnek az azokra vonatkozó találatszámok (amik belépést jelentenek az online katalógushoz). A kívánt deszkriptor találati számára kattintva annak keresése elkezdődik az unesdoc/unesbib online katalógusban. Mind a tezauruszban való kereséshez, böngészéshez, s azt követően a megtalált deszkriptor szerinti kereséshez az online katalógusban a kiinduló oldal [http://databases.unesco.org/thesaurus/ ] Bármilyen probléma esetén megjelenik az UNESCO Thesaurus help funkció 82 11.3.8. Magyar fejlesztési eredmények és távlatok Sikeres tezaurusz alkalmazások A nemzetközi és hazai tezauruszok egy fejezetben történő vizsgálata számos tanulsággal szolgálhat. Van mit tanulni a nemzetközi rendszerektől, melyeket a célirányosság, az információkeresési és – elérési funkció integrált megközelítése jellemez. A magyarországi fejlesztések, a könyvtárosok és informatikusok együttműködése révén értünk mi is értünk el komoly eredményeket! AZ OSZK-tezaurusz fejlesztésében pl. jövőbelátó módon kezeli az összefüggések ábrázolását. Így pl. az automatizált indexelés és keresés lehetőségének biztosítása felé tett lépés volt az, hogy a homonimák esetén tudatosan eltért a tezaurusz szabványtól. A homonimák szabvány szerinti megkülönböztetése hátravetett értelmezőkkel történik [pl. Asszociáció (képzettársítás), Asszociáció (társulás); Rend (állapot), Rend (szervezet)] Az OSZK-tezaurusz ehelyett vagy az LV jelű ( „lásd vagy‖), vagy az = jelű („lásd még más értelemben‖) relációkkal kezeli azokat. Ily módon Ungváry Rudolfnak olyan szerkezetű tezauruszt sikerült kialakítani, melyet a jövőben különösebb szerkezeti átalakítás nélkül lehet majd az automatikus indexelésbe vagy automatikus osztályozásba (a kettő nem ugyanaz) bevonni. Az LV jel esetében ugyanis a feldolgozó könyvtáros vagy éppen a felhasználó dönthet arról, hogy az utána felsorolt deszkriptorok közül az osztályozás/vagy információkeresés érdekében melyiket használja. 82
UNESCO Thesaurus. URL: http://databases.unesco.org/thesaurus/help.html.
159
INFORMÁCIÓKERESŐ NYELVEK II. A Könyvtári és tájékoztatási tezaurusz jól átgondolt alkalmazási rendszere is komoly siker: (1) feltárás és keresés eszköze a MANCI adatbázisban, (2) bibliográfiai adatok rendszerezési és feltárási eszköze a Magyar Könyvtári Szakirodalom Bibliográfiájában, (3) referátumgyűjtemény tételeinek rendszerezési, feltárási eszköze a Könyvtári Figyelőben. Tezaurusz – ETO alkalmazások Ungváry Rudolf83 szerint Magyarországon az ETO és a Köztaurusz az a két egyetemes rendszer, mely 10 éven belül fel fog értékelődni a szemantikus web fejlesztések hatására. A kiérlelt ontológiák piaci bevezetői ugyanis vissza fognak nyúlni az egyetemes osztályozási rendszerekhez, illetve a tezauruszokhoz. Ezek segítségével lehet majd szelektívebben és hatékonyabban megvalósítani a tömegméretűvé vált automatizált kereséseket és adathalászatot, elvégezni azokat a gépi hasonlósági találatelemzéseket, melyekkel a felhasználók tömegeinek könnyítik meg a tájékozódást a weben. Ebbe a körbe tartozik a Köztaurusz sikeres keresési, böngészési alkalmazása, pl. a HunTéka–Monguz együttműködésnek köszönhetően. A Köztauruszban megvalósuló tezaurusz-ETO konkordancia is ebbe a körbe tartozik, a deszkriptorcikkek jelentős részében megtalálhatók az ETO-számok, melyek alapján további böngészés, keresés kezdeményezhető. Az online kereshető OSZK-tezaurusz/Köztaurusz adatbázis bevezető ismertetőjében megtudhatjuk, hogy ETO-szám szerinti keresésre is van lehetőség. (Bővebb kifejtését lásd ott!) Tezaurusz szerinti keresés, böngészés a MOKKA-ban A MOKKA fejlesztési terve szerint tezaurusz keresés opció jön létre (A MOKKA közös katalógus továbbfejlesztése, 94.p.), az alábbiak szerint: A felhasználók választhassanak egy tezaurusz-keresés opciót, amely lehetőséget ad arra, hogy a tezauruszokban rejlő minden információt (a tezaurusz kapcsolatok jellege, a deszkriptor és nem-deszkriptor rekordokban lévő megjegyzések stb.) kibonthassanak, megtekinthessenek. A tezaurusz böngészés során kiválasztott kifejezéssel a felhasználó keresést indíthasson a MOKKA bibliográfiai rekordjai között. A MOKKA egyedi fejlesztésű szoftverének alkalmasnak kell lennie – a besorolási adatok HUNMARC/MARC21 X48-as, X50-es, X51-es, X55-ös adatmezők, – továbbá a SKOS szerinti, mező-almező-indikátor szerkezetű, – valamint OWL full és light formátumú tezauruszok, tárgyszójegyzékek, hierarchikus osztályozási rendszerek (például ETO), – egyéb strukturált szótárak és mutatók (a továbbiakban: tezauruszok és osztályozási rendszerek) kialakítására, szerkesztésére, karbantartására, – továbbá meghatározott formátumok szerint a kezelt állományok rekordazonosítók szerinti exportjára, ill. ugyanezen formátumok szerinti állományok importjára. (A MOKKA közös katalógus továbbfejlesztése, 107.p.)
83
UNGVÁRY Rudolf: Fejős László halálára. URL: https://listserv.niif.hu/pipermail/katalist/2009May/018399.html Katalist, 2009. május 7.
INFORMÁCIÓKERESŐ NYELVEK II. 11.3.9. Nemzetközi távlatok és ösztönzések A fogalmi kategóriák és a bibliográfiai entitások összefüggései 2007-ben a bibliográfiai leírás tárgyból már ismert FRANAR funkcionális modelljében megjelentek a „fogalom‖ entitás altípusai, a „primitív‖ entitások. A „primitív‖ jelzőnek itt logikai jelentése van: nincs ezeknél az entitásoknál alacsonyabb fokú (speciálisabb) további entitáscsoport. Ezek valójában a legáltalánosabbnak szánt fogalmak. A továbbiakban fogalmi kategóriáknak nevezzük őket. Egyrészt azért vezették be a fogalmi kategóriákat, mert az FRBR korábbi, összetett típusokat képviselő entitásai gyűjteményi szempontból, a dokumentumleírási gyakorlat alapján születtek, anélkül, hogy ezeknek az entitásoknak a mélyebb, szemantikai tartalmát feltárták volna. A fogalmi kategóriák és a gyűjteményi entitások összevetése alapján derül ki, hogy a bibliográfiai entitások e kategóriák keverékéből állnak. Például az FRBR meghatározta „személy” játszhatja az „élőlény” (ha szerző), a tárgy (ha dokumentum tárgya), vagy a fogalom (pl. a „Néró‖ fogalma) szerepét. A másik fontos cél, hogy a könyvtári besorolási állományokban a nevek és azonosítók alapján rögzített speciálisan bibliográfiai entitások az entitások általánosabb fogalmi rendszeréhez kapcsolódjanak. Ily módon eme általánosabb fogalmi rendszer egyetemesen érvényes fogalmi kategóriái hozzáférési pontként lesznek használhatók más gyűjteményi (levéltári, múzeumi, irattári) rendszerekben is. 84
37. kép 84
A fogalmi kategóriák és az FRBR entitásainak összevetése
UNGVÁRY Rudolf: MARC21/HUNMARC: a besorolási adatok metaadat-formátuma. Főbb jellemzők, fejlődés és problémák. Könyvtári figyelő, 56. évf. 2010. 1. sz. 28-30. p.
161
INFORMÁCIÓKERESŐ NYELVEK II.
Keresőnyelvi rendszerek komplex alkalmazási példája Várható, hogy tíz éven tovább erősödik a szemantikus web fejlesztésekhez elengedhetetlen minőségi hierarchikus rendszerek, tezauruszok, illetve az egyedi feltárást biztosító indexelő rendszerek komplex használata a minőségi fejlesztés útján járó teljes szövegű adatbázisok keresésében, böngészésében. Vonatkozik ez a wikipédiákra is. Az angol nyelvű Wikipédiában 2010 novemberében már 3,5 millió szócikk volt megtalálható. Már ekkor számos eszköz jelezte, hogy milyen fontos hangsúlyt helyeznek a teljes szövegű adatbázis rendszerben való minőségi keresésre, böngészésre. Ezek jelentősé részét ennek ellenére a felhasználók zöme még alig fedezte fel, alig használja. A hatalmas adatmennyiségben való eligazodáshoz különféle keresőnyelveket lehet használni, pl. betűrendes index, kategória index, Dewey Tizedes Osztályozás, Kongresszusi Könyvtár osztályozási rendszere. Ezek mellett ugyancsak igénybe vehetők különféle szótárak, tartalomjegyzékek, portálok, tudományterületek szerinti felosztások, országok és más földrajzi területek szerinti keresés, kurrens események, egyes emberek, időpontok, évszázadok, évtizedek … szerinti keresés.
38. kép
Az angol nyelvű Wikipedia által nyújtott keresési, böngészési lehetőségek
Mindezek mutatják, hogy a kialakuló óriási teljes szövegű adatbázisokban a tudás rendszerezésére, finomkeresésére egyre intenzívebben igénybe veszik az osztályozási rendszereket és tezauruszokat is. A kisebb nyelveken megvalósuló fejlesztéseket külön támogatni kell. Reméljük, tanulmányai alapján kellő motivációt kapott ahhoz, hogy ezek érdekében küzdeni is fog!
11.4
ÖSSZEFOGLALÁS
Ebben a leckében megismerkedett a legnagyobb, legjobban kidolgozott magyar tezaurusz-rendszerrel, az Országos Széchenyi Könyvtárban gondozott OSZK-tezaurusz/ Köztaurusszal. A Köztaurusz tárgyszavazásban való alkalmazása terjed a magyar könyvtárakban, miután a kezeléséhez szükséges technikai problémákat optimálisan sikerült megoldani. Jó alkalmazási példák állnak rendelkezésre, melyekből tapasztalatokat lehet meríteni. A HunTéka és Monguz együttműködésével működtetett online katalógusban lehetőség van a tezaurusz-kifejezések szerinti böngészésre és keresésre. Ld. bővebben az e-projekt keretében készült videofilmen a tezaurusz és ETO kombinált alkalmazásáról, a győri Kisfaludy Károly Megyei Könyvtár alkalmazási példáját.
INFORMÁCIÓKERESŐ NYELVEK II. A nemzetközi tezauruszok közül az ERIC, illetve az UNESCO tezaurusz funkcióit, részeit, jelölési módszereit, keresési alkalmazásait ismerte meg. A tezauruszok és más információkereső nyelvek közös alkalmazásaiból adódó lehetőségekbe tekinthetett be, melyek várhatóan az elkövetkező tíz évben valósulnak meg a szemantikus web fejlesztések keretében.
11.5
ÖNELLENŐRZŐ KÉRDÉSEK
1.
Adjon áttekintést az OSZK-tezaurusz/Köztaurusz létrehozásáról, fejlesztéséről!
2.
Adjon áttekintést az OSZK-tezaurusz/Köztaurusz rendszeréről!
3.
Ismertesse a lexikai egységek kategóriák szerinti megoszlását!
4.
Mutassa be a tezaurusz szerkezetét abban az esetben, ha deszkriptor a vezérszó!
5.
Mely összefüggések (relációk) ábrázolására kerül sor a tezauruszban?
6.
Vegye számba az OSZK-tezaurusz/Köztaurusz különféle – keresési, böngészési alkalmazásait!
7.
Melyek a sajátos lehetőségei a weben megjelenő tezauruszoknak a nyomtatott kiadásokhoz képest?
8.
Taglalja az online tezauruszok alkalmazásának sajátos előnyeit!
9.
Foglalja össze az ERIC tezaurusz adta lehetőségeket!
10. Foglalja össze az UNESCO tezaurusz által nyújtott lehetőségeket! 11. Véleménye mikor jön el az ETO és a tezauruszok „ideje‖?
163
INFORMÁCIÓKERESŐ NYELVEK II.
12.ÖSSZEFOGLALÁS 12.1
A KURZUSBAN KITŰZÖTT CÉLOK ÖSSZEFOGLALÁSA
A jegyzetünk az Információkereső nyelvek 1. kurzus anyagához kapcsolódik, annak elsajátított ismereteire támaszkodva. A célunk, hogy segítsük Önt abban, hogy ott megszerzett alapvető ismeretekre építve a dokumentumok tartalmi feltárásában, a természetes nyelven alapuló információkereső nyelvek alkalmazásának tudnivalóit, elveit, módszereit alaposan megismerje és a gyakorlatban alkalmazni tudja. A tananyag egy hasonló szerkezetű, 8 évvel ezelőtt készült jegyzetre épül. (Pálvölgyi Mihály: Információkereső nyelvek 2.) Ebbe a szerkezeti keretbe építettük be az időközben bekövetkezett változásokat, hogy az új fejleményeket, trendeket, összefüggéseket is megismerhesse. Ismerje meg a természetes nyelven alapuló információkereső nyelvek általános jellemzőit, szabályozatlanság/szabályozottság szerinti spektrumát. Erre építve nyerjen betekintést a kulcsszavazáson, tárgyszavazáson, és tezauruszok alkalmazásán alapuló IKNY-ek alapvető ismereteibe, ismerje meg típusaikat, jellegzetes és fontos példáit. Ezek alapján fejleszsze ki a tárgyalt IKNY-ek használatához, alkalmazásához szükséges készségeket, képességeket. Jegyzetünk moduláris szerkezetben tárgyalja a természetes nyelven alapuló információkereső nyelvek (IKNY-ek) típusait. A tananyagot úgy osztottuk fel, hogy az egyes IKNYtípusok elméleti, módszertani alapismereteinek megismerése után az azokra épülő konkrét rendszereket is megismerjen, és azokat a gyakorlatban is alkalmazni tudja. Az egyes leckéket úgy méreteztük, hogy képes legyen egyenletes tempóban haladni.
12.2
TARTALMI ÖSSZEFOGLALÁS
A modulárisan felépített tananyag bevezető leckéjében szabályozatlanság/szabályozottság spektrumból kiindulva megismeri a természetes nyelven alapuló keresőnyelvek fő típusait, a természetes nyelveken alapuló keresőnyelvek jellemzőit, alkalmazásait. Az indexelés modul a 2-3. leckét fogja át. Először az indexelés fogalmát és típusait tárgyaljuk, majd a kulcsszóindexek jellemzőit, készítésük és használatuk módszereit. A 3. leckében két különleges indexet ismer meg: a PRECIS-indexet, illetve a hivatkozási indexet. A PRECIS index arra jó példa, hogyan lehet megőrizni az eredeti szöveg relációit, hogyan lehet elérni, hogy az indextétel egy természetes mondatra emlékeztessen. A hivatkozási index sajátos megközelítésként abból indul ki, hogy adott szerzők kiadványaira kik hivatkoztak. A tárgyszavazási modul: az 5–8. leckét fogja át. Ebből az első kettő (5–6 lecke) a szabályozott tárgyszó-nyelv létrehozásához, fejlesztéséhez, alkalmazásához szükséges elméleti, módszertani felkészítést szolgálja. A 7. lecke a világszabványnak számító Kongresszusi Könyvtár tárgyszórendszerét, tárgyszavazási szabályait mutatja be, valamint a rendszer magyarországi alkalmazását. A 8. lecke a legfontosabb magyar általános tárgyszórendszereket tárgyalja. A tezaurusz modul 3 leckét fog át: A 9. lecke a tezaurusz készítésének, szerkesztésének elméleti, módszertani tudnivalóival ismertet meg. A 10. leckében áttekintést kapott a ma-
INFORMÁCIÓKERESŐ NYELVEK II. gyarországi tezauruszok készítésének fejlődéstörténetéről, a jelenleg épített tezauruszokról, majd az 1976 óta létező Könyvtári és tájékoztatási tezaurusz fejlesztéséről, összetevőiről, sokrétű alkalmazásairól (adatbázisban, bibliográfiában, referátumgyűjteményben feltárás és keresés eszköze). A 11. leckében az OSZK-tezaurusz/Köztaurusszal kapcsolatos legfontosabb tudnivalókat sajátította el (szerkesztés, fogalmi kapcsolatok jelölése), majd a Köztaurusz ígéretes alkalmazásaiba nyer betekintést. A nemzetközi webes tezauruszok nagy választékából a ERIC, ill. az UNESCO tezaurusz szerkesztésével, építésével, funkcionális részeivel, keresési alkalmazásait ismerte meg. Végül a tezaurusz és más információkereső nyelvek és rendszerek együttes elektronikus alkalmazási példáival, és jövőbeli fejlesztési lehetőségeivel ismerkedett meg.
12.3
A TANANYAGBAN TANULTAK RÉSZLETES ÖSSZEFOGLALÁSA
12.3.1
1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11.
Bevezetés A természetes nyelveken alapuló keresőnyelvek Indexelés. Kulcsszóindexek. Indexelés. A PRECIS és a Hivatkozási index. A tárgyszavazás alapjai 1. A tárgyszavazás alapjai 2. Nemzetközi tárgyszórendszerek. LCSH, SWD/RSWK Magyar tárgyszórendszerek és fejlesztések Információs tezauruszok - bevezetés Magyar tezauruszok. A Könyvtári és tájékoztatási tezaurusz Az OSZK-tezaurusz/Köztaurusz. Nemzetközi tezauruszok.
12.3.2 A természetes nyelveken alapuló keresőnyelvek A természetes nyelvre épülő keresőnyelvekkel tárgyunk első félévének 7. leckéjében Ön már tudatosította, hogy azok a nyelvészeti és statisztikai irányzathoz kapcsolódnak. Azt is tudatosította, hogy a mesterséges hierarchikus osztályozási rendszerektől eltérő elvek és megoldások szerint szerveződnek és működnek. Leckénkben a sokféle tipizálási lehetőség közül a szabályozatlanság/szabályozottság ellentétpárra helyeztük a hangsúlyt, ennek fogalmi tisztázásával kezdünk. Ezt követően a szabályozatlan keresőnyelvek történetileg fontos újításaival ismerkedett meg (uniterm, kulcsszórendszerek, internetes keresőrendszerek). A mindennapi nyelvhasználatra épülő szabályozatlan keresőnyelvek nem vezetnek paradicsomi állapotokhoz! Elismerve előnyeiket, a hátrányos tulajdonságaik számbavétele alapján világossá vált, hogy a pontosabb, egyértelműbb keresés érdekében elengedhetetlen a szabályozás. A zárófejezetben ezért részletesen megismerte a szabályozás indítékait, 165
INFORMÁCIÓKERESŐ NYELVEK II. céljait, területeit (szókincs, alaktan, jelentéstan, mondatalkotás) és szintjeit. A lecke áttanulmányozásával részletes áttekintéssel rendelkezik a természetes keresőnyelvek két fenti típusának előnyéről és hátrányáról. 12.3.3 Indexelés. Kulcsszóindexek A lecke 1. fejezetében betekintést nyert az index, és indexelés szerteágazó fogalmaiba és alkalmazásaiba. A 2. fejezetben az indexek típusait ismerte meg különböző megközelítések szerint. A 3. fejezettől részletesen megismerkedett a félautomatikus kulcsszavas indexek közül a KWIC-index (szövegkörnyezetes kulcsszó-index) fogalmával, újdonságaival (szövegkörnyezet mutatása, permutáció), készítésének módszertanával, előnyeivel, hátrányaival, a ciklikus permutáció technikájával, majd böngészési alkalmazásaival ismerkedik meg. Láthatta a kis költséggel és munkaigénnyel készíthető alkalmazások példáit is (nyelvészeti korpuszokban, konkordanciajegyzékekben, adatbázisokban, pl. (pl. a Dialog szolgáltatási rendszerben). Az 5. fejezet a KWIC rokonának, a szintén félautomatikus KWOC-indexnek ismerte meg a fogalmát, példán keresztül a készítési módját, előnyeit (pl. jobb áttekinthetőség), hátrányait (pl. nagyobb költség) ismerte meg. A 6. zárófejezet napjaink tömeges alkalmazásait nyújtó automatikus indexelés világába vezetett, rövid áttekintést adva az internetes keresőrendszerek működéséről. 12.3.4 A PRECIS és a Hivatkozási index A 4. leckében két indextípust ismert meg, melyek sajátos szerepet játszanak az indexek között, ami a megközelítésükből és módszereikből fakad. Először a PRECIS indexszel foglalkoztunk, melynek lényege, hogy a természetes nyelvi mondatra emlékeztető indextételek generálását teszi lehetővé, nyelvtudományi alapokra építve. A Brit Nemzeti Könyvtárban használták először, és magyarországi bevezetésére is sor került az Országos Pedagógiai Könyvtár és Múzeumban. Példák alkalmazásával megismerte a PRECIS szintaktikai szabályrendszert, az indexelés folyamatát, az indextételen belüli rotációs eljárást, és az indexelés eszközeit. Majd az index hatékonyságát hasonlítottuk össze két permutált indexével, egy példa kapcsán. Bár ma már nem használják, megőrződött az indextétel mondatszerű összeállításának módszere és elve továbbra is jelen van a feltárási gyakorlatban. A lecke második felét a hivatkozási index megismerésének szenteltük. Működési elve abból indul ki, hogy megvizsgálja, hogy adott szerzők kiadványaira kik hivatkoztak. Megismerkedett az index fő ismérveivel, adatbázisaival, azok funkcióval, majd az egyszerű, teljes és általános keresés elveivel, módszereivel. Megismerte előnyös tulajdonságait (nincs terminológiai probléma, alkalmas a hivatkozott mű és hivatkozó közötti tartalmi kapcsolat mérésére és térképezésére, segíti a tudományos teljesítmény mérését, a rangsorolás, minősítés fontos eszköze, segít követni az egyes szakterületek kutatási-fejlesztési irányait, betekintést nyert az impakt-faktor fogalmába, összefüggéseibe. 12.3.5 A tárgyszavazás alapjai 1. A tárgyszavazási modul az 5-8. leckét fogja át. Ebből az első kettő (5-6 lecke) a szabályozott tárgyszó-nyelv létrehozásához, fejlesztéséhez, alkalmazásához szükséges elméleti, módszertani felkészítést szolgálja. A kezdő leckében először meghatároztuk a tárgyszó,
INFORMÁCIÓKERESŐ NYELVEK II. tárgyszórendszer, tárgyszavazás fogalmát, fő ismérveit, majd felidéztük a tárgyszavazás elméleti, módszertani hagyományait. Ezt követően megismerte a természetes nyelv, illetve a tárgyszónyelv közötti lényegi különbségeket, majd a tárgyszavak rendszerbe szervezésének, szabályozásának elveit, módszereit. Betekintést nyert a tárgyszómegválasztás, tárgyszószabályozás alaktani, szótani, szintaktikai, jelentéstani kérdéseibe, feladataiba. Részletesen megismerte a tárgyszó, és nemtárgyszó (szinonimák) kezelésének kérdéseit, az értelmező és magyarázó szövegek használatát, a tárgyszókapcsolatok egyszerűbb és differenciált, tezauruszra emlékeztető jelölési módjait. Áttekintette a tárgyszórendszer szervezési szintjével kapcsolatos alternatívákat. Végül a szabályozási elvek megismerésével tudatosította, hogy a szabályozás elvégzése és érvényesítése a tárgyszavas információkereső nyelv alkalmazásának alapfeltétele. 12.3.6 A tárgyszavazás alapjai 2. A tárgyszavazás alapjai elsajátításának második részében először tudatosította a tárgyszórendszerrel, tárgyszavazással kapcsolatos elvárásokat. Ezt követően elsajátította a tárgyszókategóriákkal kapcsolatos tudnivalókat, azok jellemzőit, azt, hogy nagy vonalakban visszatükrözik az általános fogalmi kategóriák alkategóriáit (személyi, tárgyi, folyamat, hely, idő, dokumentumforma). Megismerte, hogy a bibliográfiai rekord adatmezőjében milyen helyet kapnak az egyes tárgyszókategóriák a HUNMARC szabvány szerint. Elsajátította a szövegösszefüggések ábrázolásához (indexeléséhez) szükséges alapfogalmakat (tárgyszavas indexelés, eredménye a tárgyszavas indextétel, összetevői: a tárgyszavas indexkifejezések.) Megismerte az indexelés alapelveit, lépéseit, az indextételen belüli sorrend lehetséges alternatíváit, jellegzetes példáit.(PRECIS-szerinti indexelés, Ranganathan módszere stb.) Áttekintést nyert a tárgyszó karbantartási és szabályozási folyamatának különféle vetületeiről és eszközeiről, a rendszerfejlesztés öt legfontosabb kérdéséről. Összességében megszerezte azokat az alapismereteket, melyekre építve képes konkrét tárgyszórendszerek szisztematikus elemzésére, értékelésére. 12.3.7 Nemzetközi tárgyszórendszerek: LCSH, SWD/RSWK A 7. lecke a világszabványnak számító LCSH-t a Kongresszusi Könyvtár tárgyszórendszerét, tárgyszavazási szabályait mutatja be. Az 1. fejezetben betekintést nyert a Könyvtár több mint 110 éves fejlődéstörténetébe. Ezt követően a tárgyszórendszer fő ismérveit, formáját, tárgyszókategóriáit ismerte meg példák segítségével. Tekintettel arra, hogy világszerte használják, fontos, hogy megismerkedjünk fejlesztésének, szabályozásának fő módszereivel, eljárásaival. Példákon keresztül sorra vettük a szótani, alaktani, jelentéstani szabályozásokat. Ezt követte az indexelési szabályok megismerése (4. fejezet), majd az elkészült indextételekre épülő keresési és böngészési lehetőségek számbavétele. A tárgyszórendszer mind nyelvi, mind logikai szempontból alaposan kidolgozott és karbantartott. A tezauruszra emlékeztet a tárgyszavak közötti logikai kapcsolatok jelölési módja. Sajátos az indexelési módszere, mely a főtárgyszavak mellett al-, és melléktárgyszavakat használ, és ezzel a böngészéshez jól áttekinthető listákat szolgáltat. Fontos tanulságokkal szolgálnak azok a módszerek, szervezési eljárások, melyek a tárgyszórendszer folyamatos fejlesztésére irányulnak. A fejlesztésnek, az azzal összefüggő együttműködésnek globálisak a keretei. Érdemes volt megismerni, és megszívlelni azokat 167
INFORMÁCIÓKERESŐ NYELVEK II. a hatékony adminisztratív eljárásokat, amelyek segítik a tárgyszórendszer folyamatos fejlesztését. (5. fejezet) A zárófejezetben (6. fejezet), további nemzetközi tárgyszórendszerek közül a francia, majd részletesebben a német tárgyszórendszert és tárgyszókatalógus szabályzatot mutattuk be. A MACS projekt az Európai Unión belüli összehangolt fejlesztésre hívta fel a figyelmet. 12.3.8 Magyar tárgyszórendszerek Az általános magyar tárgyszórendszerek közül először részletesen megismerhette a fejlődéstörténeti szempontból is jelentős Új Könyvek tárgyszójegyzéket. Először létrejöttének, fejlesztéseinek tényeit taglaltuk. Majd részletes áttekintést kapott a tárgyszószabályozás egyes területeiről. Példákon keresztül áttekintést nyert az alaktani, szótani, jelentéstani szabályozásról. A tárgyszavak közötti logikai kapcsolatok ábrázolására is kifejlesztettek eszközöket. A tárgyszókategóriákat példákon keresztül ismerte meg, melyekhez saját példákat is fűzhet. Az indexelés sajátos szabályainak megismeréséhez szintén számos példát tanulmányozhatott. Végül áttekintettük a rendszer alkalmazásának eredményeit és tapasztalatait. Ezt követően az LCSH magyar változatát ismerhette meg, melyet a Debreceni Egyetem Egyetemi és Nemzeti Könyvtára gondoz. Példákon keresztül elemeztük a magyar könyvtermést a Kongresszusi Könyvtár angol nyelvű tárgyszavai mellett magyar változatban (fordításban) is tárgyszavazó rendszer sajátosságait. A zárófejezetben áttekintést kapott a magyarországi általános tárgyszórendszer fejlesztés fő elméleti, módszertani, gyakorlati állomásaiba, (Általános Tárgyszójegyzék Tervezet, OSZK-tezaurusz/Köztaurusz, MÁTRIKSZ-program). Végül ösztönzést kapott, hogy a tanulmányai során már korábban megismert kritériumok szerint röviden elemezze a tárgyszó modulban megismert tárgyszórendszereket. 12.3.9 Információs tezauruszok bevezetés A tezauruszok az 1960-as években jelentek meg az információkereső nyelvek sorában. Mind nyelvi, mind logikai értelemben a legerősebben szabályozott keresőnyelvek. Szemantikai információkereső nyelvként való értelmezésük jelzi potenciális szerepüket a web 3.0-nak is nevezett szemantikus web alkalmazásokban. E leckében betekintést nyert a tezaurusz mint szabályozott keresőnyelv ismérveibe, megismerte funkcióit, funkcionális részeit (főrész, jelentéskörök szerinti rész, hierarchikus rész, permutált betűrendes rész, grafikus-vizuális rész), és azok szerepét az egyértelmű, pontos feltárásban és keresésben. Betekintést nyert a tezauruszépítés, -fejlesztés, -alkalmazás műhelytitkaiba, a tezauruszban való keresés pedig a félév egyik kiemelt feladata volt. Megszerezte azokat az alapismereteket, melyek alapján a kurzus két hátralevő leckéjében a tezaurusz rendszerek sajátos alkalmazásait, sajátos jellemzőit megértheti. 12.3.10
Magyar tezauruszok. A Könyvtári és tájékoztatási tezaurusz
A lecke elején áttekintést kapott a mennyiségileg imponáló magyarországi tezauruszfejlesztésekről. Szellemi előkészítésben, végrehajtásban nem volt hiány, de a szervezésben, a hatékony, ésszerű alkalmazás megszervezésében igen. Az 1970-es évektől kidolgozott
INFORMÁCIÓKERESŐ NYELVEK II. tezauruszok használat ideje szerinti elemzése olykor lehangoló, számos olyan van, amelyet kidolgoztak, de nem is használtak. Az élő rendszereket röviden áttekintettük. A 2. fejezettől az 1976 óta folyamatosan használt és fejlesztett Könyvtári és tájékoztatási tezaurusszal (KTT) ismerkedett meg részletesen. Megismerte a szabályozás területeit, a kapcsolatjelölési módok változásait (deszkriptorok, megjegyzések, szinonimák, logikai kapcsolatok vonatkozásában). Betekintést nyert az 1976 óta folyamatosan élő, fejlődő tezaurusz hatékony alkalmazási módjaiba (Könyvtártudományi szakkönyvtárban a feltárás, dokumentumelrendezés eszköze, a Magyar Könyvtári Szakirodalom Bibliográfiájában (MAKSZAB), illetve a Könyvtári Figyelő külföldi folyóirat-figyelő rovatában az elrendezés és feltárás eszköze. 12.3.11
Az OSZK-tezaurusz/Köztaurusz. Nemzetközi tezauruszok
Ebben a leckében megismerkedett a legnagyobb, legalaposabban kidolgozott magyar tezaurusz-rendszerrel, az Országos Széchenyi Könyvtárban gondozott OSZK-tezaurusz/ Köztaurusszal. A Köztaurusz tárgyszavazásban való alkalmazása terjed a magyar könyvtárakban, miután a kezeléséhez szükséges technikai problémákat optimálisan sikerült megoldani.Jó alkalmazási példák állnak rendelkezésre, melyekből tapasztalatokat lehet meríteni. A HunTéka és Monguz együttműködésével működtetett online katalógusban lehetőség van a tezaurusz-kifejezések szerinti böngészésre és keresésre. Ld. bővebben az e-projekt keretében készült videofilmen a tezaurusz és ETO kombinált alkalmazásáról, a győri Kisfaludy Károly Megyei Könyvtár alkalmazási példáján. A nemzetközi tezauruszokat megadott linkgyűjtemények szerint áttekinthette. Részletesebben a már korábban megismert ERIC, illetve az újonnan megismert UNESCO tezaurusz funkcióit, részeit, jelölési módszereit, keresési alkalmazásait vettük át. A lecke végén az eredmények és távlatok számbavétele következett, először magyar majd nemzetközi szempontból. A tezauruszok és más információkereső nyelvek közös alkalmazásaiból adódó lehetőséget, a közeljövő várható fejlődési irányait tekintettük át.
12.4
EGYÉB
A tananyagban található internetes hivatkozások ellenőrzése: 2010.október 18.
169
INFORMÁCIÓKERESŐ NYELVEK II.
13.KIEGÉSZÍTÉSEK 13.1
IRODALOMJEGYZÉK
Könyv HORVÁTH Tibor: Az általános tárgyszójegyzék munkálatairól = Könyvtári Figyelő, 2. (38.) évf. 1992. 610-617.p HORVÁTH Tibor, SÜTHEŐ Péter: A tartalmi feltárás. In: Könyvtárosok kézikönyve. 2. köt. Feltárás és visszakeresés. Bp. : Osiris, 2001. KÖRNYEI Márta: Könyvtári osztályozás 1. köt. Bp.: Tankönyvkiadó, 1990. Magyar nyelvű információkereső tezauruszok szerkezete, részei és formái. Budapest: 1987. Magyar Szabvány. (MSZ 3418-87) SLAVIC, Aida: Use of the Universal Decimal Classification: A world-wide survey = Journal of Documentation. Vol. 64. Issue 2. 2008. p. 211-228. Tárgyszójegyzék és tárgyszómutató az Új Könyvek 1965-1976. évfolyamaihoz. Budapest, 1980. VARGA Katalin: Szöveg és tartalom az információs társadalomban : módszerek és lehetőségek az információ minőségi szelektálására. [közreadja a] Pécsi Tudományegyetem Felnőttképzési és Emberi Erőforrás Fejlesztési Kar. Pécs : PTE FEEK, 2005. Elektronikus dokumentumok / források BÁNKI Zsolt: MÁTRIKSZ – Magyar Átfogó Tárgyi Információkereső-nyelvi Szótár : Új fejezet a tartalmi visszakeresésben = Könyvtári Figyelő, 47. évf. 2001. 4. sz. 672678. URL: http://epa.oszk.hu/00100/00143/00040/banki.html BARKI Katalin, PREJCZER Paula: Számítógépes katalogizálás HUNMARC formátumban. Az elektronikus változatot szerk. BARKI Katalin. Szombathely, 2003. URL: http://www.bdtf.hu/konyvtar/oktatas/marc/index.htm CSIK Tibor, VARGA Katalin: A tudás és az információfeldolgozás = Tudományos és Műszaki Tájékoztatás, 52. évf. (2005) 7-8. sz. URL: http://tmt.omikk.bme.hu/show_news.html?id=4007&issue_id=464 DARÁNYI Sándor: Osztályozási rendszerek, információkereső nyelvek I. Szeged: SZTE BTK Könyvtártudományi Tanszék, é.n. URL: http://www.bibl.uszeged.hu/inf/kurzus/alapkepzes/osztalyozas-1.pdf Derek Austin és a PRECIS. In: UNGVÁRY Rudolf, ORBÁN Éva: Osztályozás és információkeresés. Kommentált szöveggyűjtemény. Bp.: Országos Széchenyi Könyvtár, 2001. 1. köt. – Az osztályozás elmélete. 288-327. p. URL: http://mek.oszk.hu/01600/01683/pdf/01683-1.pdf GÁNCSNÉ NAGY Erzsébet, LENGYEL Monika: Következetes tartalmi feltárás szoftvercsere mellett? A KÖZTAURUSZ használata a győri Kisfaludy Károly Megyei Könyvtárban = Tudományos és Műszaki Tájékoztatás, 53. évf. (2006) 7-8. sz. URL: http://tmt.omikk.bme.hu/show_news.html?id=4493&issue_id=474
INFORMÁCIÓKERESŐ NYELVEK II. HORVÁTH Tibor, ORBÁN Éva: PRECIS = Tudományos és Műszaki Tájékoztatás. URL: http://tmt.omikk.bme.hu/show_news.html?id=3072&issue_id=371 HUNMARC Bibliográfiai Formátum funkcionális analízise. HUNMARC bibliográfiai formátum - FRBR megfeleltetés. URL: http://www.oszk.hu/hun/szakmai/hunmarc/HM_FRBR_Tabla1.pdf KOVÁCS Katalin: Boldog születésnapot, TMT! A könyvtáros szaklapok köszöntői = Tudományos és Műszaki Tájékoztatás 50. évf. (2003) 9-10. sz. URL: http://tmt.omikk.bme.hu/show_news.html?id=3366&issue_id=444 KUNZ, Martin: Regeln für den den Schlagwortkatalog : RSWK / hrsg. von der Arbeitsstelle für Standardisierung. Red.: - - . Arbeitsstelle für Standardisierung. Frankfurt am Main /Expertengruppe RSWK-SWD Leipzig [u.a] : Deutsche Nationalbibliothek, 2007. 480 p. URL: http://files.dnb.de/pdf/rswk_gesamtausgabe.pdf A MOKKA közös katalógus továbbfejlesztése. Szakértői vélemény. Munkaanyag. 2010.03.23. Készítette a MOKKA szakértői munkacsoportja. 193 p. URL: http://www.mokka.hu/files/tamop/A_MOKKA_tovabbfejlesztese_5_20100323.pdf Regeln für den Schlagworkatalog RSWK. 3., überarbeitete und erweiterte Auflage auf dem Stand der 5. Ergänzungslieferung April 2009. URL: http://files.dnb.de/pdf/rswk_gesamtausgabe.pdf RÓNAI Mónika: Információkereső tezaurusz a magyar leírószófajtan témaköréből = Tudományos és Műszaki Tájékoztatás. 56. évf. 2009. 5. sz. URL: http://tmt.omikk.bme.hu/show_news.html?id=5143&issue_id=504 RÓNAI Tamás: Az amerikai és német tárgyszórendszerekről = Könyvtári Figyelő, 40. évf. 1994. 2. sz. URL: http://epa.oszk.hu/00100/00143/00010/ronai_h.html SARACEVIC, Tefko - GARFIELD, Eugene: On measuring the publication productivity and citation impact of a scholar: A case study. In: Ingwersen Festschrift. 187.p. URL: http://comminfo.rutgers.edu/~tefko/Saracevic%20Garfield%20%20Ingwersen%20Festschrift%202010.pdf SCHUBERT András: Impakt faktor. Összeáll. --. URL: http://www.kfki.hu/library/imp/impakt_faktor.htm SZABÓ Julianna:A MOKKA HUNMARC rekordja. Bibliográfiai rekordok. A tartalmi feldolgozás mezői. Katalogizálási segédlet, 2006. Összeáll. --. URL: http://www.mokka.hu/files/HUSwebre/MORChu/TARhm.doc TÉGLÁSI Ágnes: Elektronikus Információ Szolgáltatás (EISZ) nemzeti program. In: Könyvtár és társadalom vonzásában. Köszöntőkönyv dr. Tóth Gyula 70. születésnapjára. Szerk CZÖVEK Zoltán, KOLTAY Tibor, PÁLVÖLGYI Mihály. Szombathely, 2008. Savaria University Press. URL: http://www.bdf.hu/btk/trsi/kvtar/Kutats%20tudomnyos%20mhelyek/Tanszéki%20ki adványok/Tanulmányok%20a%20Könyvtár%20és%20Információtudományi%20Tanszék%20műhelyéből/1_Konyvtar_es_tarsa dalom_vonzasaban.pdf TIBERI, Melissa; MAZZOCCHI, Fulvio: La gestione della polisemia nei thesauri. Il caso dei termini filosofici.= Boll. AIB. 47.vol. 2007. 1/2.no. 93-107.p. Ismert. MOHOR Jenő: A poliszémia kezelése a tezauruszokban: a filozófiai szakszókincs esete = Könyvtári Figyelő, 2008.1. sz. URL: http://w3.oszk.hu/manscr/wwwi32.exe/[in=ref1.in]/?08/039*60390 171
INFORMÁCIÓKERESŐ NYELVEK II. UNGVÁRY Rudolf: Fejős László halálára. URL: https://listserv.niif.hu/pipermail/katalist/2009-May/018399.html Katalist, 2009. május 7. UNGVÁRY Rudolf: OSZK TEZAURUSZ/KÖZTARUSZ. Az Országos Széchényi Könyvtár és a Közművelődési könyvtárak átfogó tezaurusza. 3.0 változat. Főszerkesztő: - -.. Budapest, Magyar Könyvtárosok Egyesülete, Országos Széchenyi Könyvtár. 2002. december 31. URL: http://mek.oszk.hu/00700/00769/html/ UNGVÁRY Rudolf: A tezauruszokról. URL: http://www.oszk.hu/hun/szakmai/tezaurusz/tezaurusz_oszk_hu.htm UNGVÁRY Rudolf: Strukturált információkereső-nyelvi szótárak (tezauruszok) : magyarországi helyzetkép, lehetőségek, fejlesztési nehézségek. URL: http://dsd.sztaki.hu/conferences/infrastruktura/eloadasok/ungvary/ungvary.doc UNGVÁRY Rudolf: Tezaurusz-szerkesztés: A Köztaurusz használata könyvtári rendszerekben.URL: www.omgk.hu/pages/Aleph_2007/ungvary.pps VÁRADI Tamás: The Hungarian National Corpus. In: Proceedings of the 3rd LREC Conference, Las Palmas, Spanyolország, 2002. 385-389. p. URL: http://corpus.nytud.hu/mnsz; http://corpus.nytud.hu/cgi-bin/hnctest/hnc_hun.cgi VARGA Katalin: A magyar szakirodalom tartalmi reprezentációjának jelenlegi állapota = Tudományos és Műszaki Tájékoztatás, 52. évf. 2005. 7-8. sz. URL: http://tmt.omikk.bme.hu/show_news.html?id=4008&issue_id=464 WYNAR, B.S.: Introduction to Cataloguing and Classification. 8th ed. Littleton, CO: Libraries Unlimited, Inc., 1992. Internet források: weblapok, szócikkek, bibliográfiák, útmutatók Bibliotheque nationale de France. URL: http://www.bnf.fr/fr/acc/x.accueil.html Cardbox [általános célú adatbázis]. URL: www.cardbox.com/v2/kwic.htm Corvina Vocal kereső. URL: http://odr.lib.klte.hu/ Corvina Vocal tárgyszó-adatbázis. URL: http://odr.lib.unideb.hu/corvina/odr/term_search Debreceni Egyetem Nemzeti és Egyetemi Könyvtár. URL: http://www.lib.unideb.hu Debreceni Egyetem Nemzeti és Egyetemi Könyvtár Központi katalógus. URL: http://webpac.lib.unideb.hu/WebPac/CorvinaWeb, illetve http://webpac.lib.unideb.hu/WebPac/ Deutsche Nationalbibliothek. URL: https://portal.d-nb.de/ Elektronikus Információ Szolgáltatási program. URL: http://www.om.hu/eisz ERIC Educational Resources Information Center. URL: http://www.eric.ed.gov/ ERIC Educational Resources Information Center Web Portal. Thesaurus. URL: http://www.eric.ed.gov/ERICWebPortal/thesaurus/thesaurus.jsp ERIC Thesaurus Web portal. URL: http://www.eric.ed.gov/ERICWebPortal/gotoThesaurusDetail.do?term=Electronic+ Learning HUMANUS adatbázis. URL: http://humanus.bibl.u-szeged.hu/human/cikk-mokka Institute for Scientific Information [wikipedia szócikk]. URL: http://en.wikipedia.org/wiki/Institute_for_Scientific_Information ISI Citation Database Help. URL: http://wos.isitrial.com/help/helpquik.html Konkordancia [Wikipédia szócikk]. URL: http://hu.wikipedia.org/wiki/Konkordancia
INFORMÁCIÓKERESŐ NYELVEK II. Library of Congress Authorities. URL: http://authorities.loc.gov/ Library of Congress Cataloging and Acquisitions URL:http://www.loc.gov/aba/ Library of Congress Classification Web URL: http://www.loc.gov/cds/classweb/ Library of Congress Program for Coperative Cataloging. URL: http://www.loc.gov/catdir/pcc/ Library of Congress Subject Headings. Weekly List. 2010. URL: http://www.loc.gov/catdir/cpso/wls10/awls1003.html Library of Congress Online Catalog. http://catalog.loc.gov/ ) MANCI adatbázis tezaurusz funkció. URL: http://w3.oszk.hu/ sugó manhtm/help.htm MÁTRIKSZ http://www.matriksz.hu/ OSZK Tezaurusz/Köztaurusz alkalmazásokat segítő eszközök URL: http://mek.oszk.hu/00700/00769/html/ OSZK Tezaurusz/Köztaurusz. Kereshető adatbázis. URL: http://mek.oszk.hu/adatbazis/thes.htm Az OSZK Tezaurusz/Köztaurusz rendszere. URL: http://mek.oszk.hu/00700/00769/html/ RAMEAU. URL: http://rameau.bnf.fr/index.htm Subject Authorities Cooperative Program. URL: http://www.loc.gov/catdir/pcc/saco/saco.html Subject/Classification Proposal Forms and Guidelines. URL: http://www.loc.gov/catdir/pcc/saco/proposal_forms.html Support : Dialog Search Aids: Successful Search Aids: Successful Searching: SET: Set KWIC. URL: http://support.dialog.com/searchaids/success/set_kwic.shtml Új Könyvek 1994-2000. CD-ROM. Bp.: ARCANUM, 2002. UNESCO Thesaurus URL: http://databases.unesco.org/thesaurus/ UNESCO Thesaurus. URL: http://databases.unesco.org/thesaurus/help.html. UNESCO Thesaurus Databases. URL: http://databases.unesco.org/thesaurus/ Web Concordancer (English). URL: http://www.edict.com.hk/concordance/WWWConcappE.htm; http://www.edict.com.hk/scripts/cgi-bin/Wwwconcgram.exe Mellékletek Charles Ammi Cutter [Kép] URL: http://commons.wikimedia.org/wiki/File:CharlesAmmiCutter_BostonAthenaeum.pn g OSZK Tezaurusz / Köztaurusz : Tárgyszójegyzék [tezauruszcikk] URL: http://mek.oszk.hu/cgi-bin/thes.cgi?desc=t%e1rgysz%f3jegyz%e9k&trunc=0 Roget Peter Mark (1779-1869) [Kép] URL: hypericum.wordpress.com Uniterm kártya Boole-algebrai metszete. URL: http:))hypatia.slis.hawaii.edu)~prototype)lis670)indexing)slide13.html
173