Информационно-поисковые тезаурусы ИНИОН РАН

ВНИМАНИЕ! По причине временных технических трудностей информационно-поисковые тезаурусы в настоящее время не встраиваются в отраслевые базы данных ИНИОН РАН. При составлении запросов рекомендуется использовать электронные версии информационно-поисковых тезаурусов, размещённые непосредственно на данном сайте. Ссылки на последние версии всех тезаурусов доступны на странице Базы данных ИНИОН РАН.

Назначение и область применения информационно-поисковых тезаурусов (ИПТ)

Информационно-поисковые тезаурусы (ИПТ) ИНИОН РАН используются как вспомогательный инструмент при поиске информации в библиографических базах данных, а также для качественной обработки библиографами поступающей в библиотеку литературы. В каждом ИПТ дескрипторы (поисковые термины) из определённой отрасли науки связаны парадигматическими отношениями (вышестоящий — нижестоящий, ассоциативный, синоним). Таким образом, использование тезауруса позволяет читателю расширить или, наоборот, конкретизировать свой поисковый запрос, чтобы получить более полные и релевантные результаты. Библиотекарям, отвечающим за каталогизацию новых поступлений, тезаурус позволяет избежать разночтений при назначении ключевых слов библиографическим записям.

Отраслевые тезаурусы ИНИОН РАН обеспечивают как отраслевой, так и межотраслевой поиск информации. Тематический охват каждого тезауруса базируется на практике информационной деятельности нашего института и структуре научного знания с соблюдением принципа историзма. Каждый тезаурус отражает содержание потока российских и зарубежных публикаций, относящихся к определённой отрасли знания, и ориентирован на обслуживание информационных потребностей специалистов в целом. Документы, поступающие в банк данных ИНИОНа, включают в себя практически все виды изданий: монографии, статьи из журналов и сборников, авторефераты диссертаций, депонированные рукописи, рецензии, обзоры, материалы научных конференций и т. п.

Тезаурусы ИНИОНа предназначены как для индивидуальных пользователей, так и для научно-информационных центров и библиотек.

В процессе подготовки тезаурусов используется служебная лингвистическая база данных, программное обеспечение которой позволяет формировать указатели различных типов, осуществлять проверку семантических связей в словарных статьях, формирование издательских файлов и ряд других операций. Служебная лингвистическая база необходима для периодического пополнения тезаурусов новой терминологией, создания новых словарных статей и обеспечивает замену устаревшей версии тезауруса на актуализированную.

История разработки

Разработка информационно-поисковых тезаурусов началась в 1998 году силами рабочей группы под руководством Р. Р. Мдивани. Всего с 2001 по 2014 год было издано (в бумажном виде) 11 тезаурусов:

Название тезауруса Год издания Количество дескрипторов

Экономика. Демография

2001

  4 821

Философия

2002

  3 378

Правоведение

2002

  8 100

Социология

2003

  2 322

Языкознание

2007

  2 978

Политология

2007

  6 900

Религиоведение

2008

  1 853

Литературоведение

2010

  1 116

Науковедение

2011

  6 626

История. Археология

2012

10 080

Этнология. Антропология

2014

  5 544

Семь из них в 2001–2010 годах были также интегрированы в систему библиографических баз данных ИНИОНа. По техническим причинам дальнейшее продолжение этой работы оказалось невозможным, тогда как число новых терминов в служебной лингвистической базе для ведения тезаурусов продолжало неуклонно расти, так что тезаурусы, изданные в начале 2000‑х годов, к середине 2010‑х уже заметно устарели. Поскольку новая автоматизированная библиотечная система до сих пор находится в стадии разработки, в 2018 году в качестве временной меры было решено продолжить издание обновлённых версий тезаурусов в виде PDF-файлов.

Источники лексики

Массив терминологии, представленной в актуализированных словарных статьях информационно-поискового тезауруса, основан на анализе информативных полей (заголовок, аннотация, поле ключевых слов) документов, представленных в библиографических базах данных ИНИОНа. Это обеспечивает соблюдение принципа смыслового соответствия дескрипторов тезауруса содержанию документов.

Тезаурус содержит:

Термины тезауруса обладают достаточным уровнем специфичности и обеспечивают эффективную индексацию документов и запросов.

Состав и структура указателей тезауруса

Каждый тезаурус состоит из двух указателей:

АЛФАВИТНЫЙ ЛЕКСИКО-СЕМАНТИЧЕСКИЙ УКАЗАТЕЛЬ — основная часть тезауруса. В нём представлены все заглавные дескрипторы и аскрипторы (условные синонимы) со словарными статьями.

Заглавный дескриптор объединяет в себе два вида терминов:

Индексные термины — это термины, которыми библиографы проиндексировали документ. В базе данных они находится в поле ключевых слов.

Поисковые термины — термины, взятые из заголовков и аннотаций. В поле ключевых слов часто отсутствуют.

Исходя из этого, рекомендуется использовать поиск сразу по всем полям базы данных (выберите Общий словать [ALL] в качестве поля для поиска).

Заглавные дескрипторы выделяются жирным шрифтом, аскрипторы — курсивом. Словарные статьи упорядочены по алфавиту.

Словарная статья дескриптора состоит из заглавного дескриптора, связанного по смыслу парадигматическими отношениями с другими дескрипторами и аскрипторами. В число связей входят:

Заглавный дескриптор может сопровождаться справкой, уточняющей значение дескриптора в тезаурусе или правило его использования при индексировании документов и запросов. В ряде исключительных случаев справки (SN) могут содержать перекрёстные ссылки «см. также», связывающие эквивалентные по смыслу, но различные по форме дескрипторы, появившиеся по разным причинам в библиографическом банке данных за длительный срок эксплуатации системы. Это позволяет обеспечить полноту выдачи документов при формулировке запроса. Парадигматические связи приводятся при одном из дескрипторов. Например (примеры приводятся из ИПТ «Этнология. Антропология»):

  аборигены
  SN см. также коренное население
     
  коренное население
  SN см. также аборигены
  BT население
  NT индейцы
  RT коренизация кадров
    коренные народы
    малочисленные народы
    международно-правовая защита
    международное право
    национальные интересы
    поселения
    резервации
    самоуправление
    сегрегация
    фамилия
    хозяйственное освоение территории
    экономическое положение
    этническая самоидентификация
    этнические меньшинства
    этнокультурная адаптация
  UF аборигенность
    дигенность
    индигенность
    туземцы

Словарная статья дескриптора содержит следующие обозначения парадигматических связей с другими терминами:

заглавный дескриптор

  SN  

(scope note) — текстовая справка

  BT

(broader term) — вышестоящий дескриптор

  NT

(narrower term) — нижестоящий дескриптор

  RT

(related term) — ассоциативный дескриптор

  UF

(used for) — аскрипторы, заменяемые при индексировании на заглавный дескриптор

Заглавный дескриптор является обязательным элементом словарной статьи, а остальные — факультативными.

Ещё один пример дескрипторной словарной статьи:

  межнациональные отношения
  SN см. также национальные отношения
  BT этнополитология
  NT национальная консолидация
    национальная нетерпимость
    толерантность
  RT ближнее зарубежье
    глобализация
    гражданское общество
    демократизация
    диалог культур
    диаспоры
    интернационализм
    межнациональное общение
    национальные противоречия
    национальный вопрос
    правовое регулирование
    расовые отношения
    русскоязычное население
    терроризм
    трансграничье
    этнические границы
    этнические стереотипы
    этноконфессиональные отношения
    этнополитика
    этнополитические процессы
    языковая проблема
  UF бытовой шовинизм
    межнациональные противоречия

Словарные статьи аскрипторов. Аскрипторы выделяются курсивом. От каждого аскриптора даётся отсылка к дескриптору, заменяющему его при индексировании.

Словарная статья аскриптора состоит из самого аскриптора и отсылки к дескриптору после обозначения USE. Например:

  прародина человека
  USE антропогенез
     
  происхождение человека
  USE антропогенез

Аскрипторы приводятся в словарной статье соответствующего дескриптора:

  антропогенез
  BT историческая антропология
    палеоантропология
  RT антропосоциогенез
    биоархеология
    бипедализм
    внутривидовая дифференциация
    гоминиды
    гоминины
    онтогенез
    приматы
    расоведение
    расогенез
    социогенез
    филогенез
    человек
    человек первобытный
    человек разумный
    эволюции теория
  UF прародина человека
    происхождение человека

Алфавитный лексико-семантический указатель используется для поиска нужного дескриптора и его парадигматических связей с другими дескрипторами. Этот указатель обеспечивает возможность адекватной формулировки запроса, а при неудовлетворительных результатах поиска — изменение стратегии поиска, в том числе за счёт использования дескрипторов, входящих в словарную статью.

ПЕРМУТАЦИОННЫЙ УКАЗАТЕЛЬ (KWIC — ключевые слова в контексте) — вспомогательный указатель к алфавитному лексико-семантическому. Содержит дескрипторы и аскрипторы без словарных статей. Дескрипторы выделены жирным шрифтом, аскрипторы — курсивом. Специфической особенностью пермутационного указателя является формирование так называемых словарных гнёзд по однословным терминам и по ключевым словам, входящим в состав терминов-словосочетаний. Упорядочение производится по алфавиту каждого ключевого слова. Таким образом, для каждого такого слова формируется словарное гнездо, показывающее его место в контексте. В зависимости от количества входящих в них слов дескрипторы и аскрипторы могут дублироваться в нескольких словарных гнёздах.

Пермутационный указатель используется для поиска по ключевым словам нужных дескрипторов в соответствующем словарном гнезде. Приведём примеры.

Если пользователя интересует термин ПУТИ, который обычно входит в состав словосочетаний, то ему следует обратиться к соответствующему словарному гнезду:

морские
речные
торговые

транспортные

 

 

пути
пути

пути
пути
пути миграции

пути сообщения

Соответственно, каждый термин этого словарного гнезда включён и в другие гнёзда, например, по первому слову словосочетаний:

                                    

морские пути
морские экспедиции
морское дело

     
   

торговые пути
торговые связи

торговые сооружения

Выбранные по пермутационному указателю термины целесообразно проверить в алфавитном лексико-семантическом указателе, где представлены словарные статьи дескрипторов с семантическими связями, а также синонимы с дескрипторами, заменяющими их при поиске.

См. также