Використання ключових слів і рубрикатора ДАСНТІ в індексуванні документів
(З досвіду роботи відділу наукової обробки документів)
Туринге Людмила Олександрівна,
зав. відділом обробки
наукової бібліотеки
Кемеровського державного університету
Згідно ГОСТ 7.74- 96 ключовий слово - це інформативне слово, наведене в стандартній лексикографічної формі і використовується для координатного індексування. Координатне індексування - це індексування, що передбачає багатоаспектне вираження основного змісту документа або смислового змісту інформаційного запиту безліччю ключових слів. Сукупність ключових слів становить пошуковий образ документа (ПОД). Перевага методу координатного індексування проявляється при необхідності багатоаспектного пошуку інформації на певну тему. При цьому найважливіші критерії оптимальної роботи - повнота видачі документів і їх релевантність запиту.
Слова і словосполучення для предметного входу складаються за певними правилами. Ключові слова - це найбільш значущі слова з тексту. Вони являють собою:
- переважно іменники;
- іменники з прикметниками;
- персоналії;
- власні імена;
- географічні назви;
- абревіатура;
- числівники;
- вводяться синоніми;
- застосовується форма множини;
- називний відмінок;
- вид видання;
- терміни, що позначають процеси і вид діяльності;
- поняття, які називають галузь знання;
- не вводяться словосполучення з союзом "і".
Рубрикатор ДАСНТІ - один з загальносистемних ІПМ. Рубрикатор знаходиться в загальному ряду з УДК, ББК і іншими ІПМ і не скасовує їх, а використовується одночасно з ними. Рубрикатор ДАСНТІ створений для автоматизованих систем НТІ. Його відрізняє мала глибина ієрархії (три рівня), досить висока мобільність, видимість схеми класифікації і можливість оперативного внесення змін. Його семантична сила набагато менше, ніж у інших ІПМ. Обсяг збірника включає 6118 рубрик.
Практичне використання Рубрикатора виявило ряд обмежень, які випливають з особливостей структури і призначення цього ІПМ: він призначений для відображення найважливіших аспектів документів і запитів і забезпечує розподіл усього потоку на великі блоки, але не має достатньо коштів для детального відображення документів. Як мова тематичного опису Рубрикатор є класифікаційним інструментом, взаємно доповнюють інші класифікації. Він не замінює ІПМ дескрипторного типу, а спільне їх застосування дає значний ефект при автоматизованому пошуку інформації.
Зусилля фахівців по глибокому, повного, точного індексування окупляться в результаті вдячністю читачів.
Як можна організувати пошук в ЕК, якщо читач не може у формулюванні слова? Повинен бути діалог читача з ЕК, бажано в режимі "питання-відповідь". Якщо будуть більш досконалі програми, то можна буде розвивати діалоговий пошук.