21 апреля (четверг) 2011 г. в 11.00 в Малом конференц-зале состоится заседание Ученого совета ИНИОН РАН.

 

 

Повестка дня

 

1. Доклад «Структура библиографической базы данных по истории, археологии, этнологии и принципы построения отраслевого тезауруса» –

докл. к.и.н. Е.Ю. Матвеева

 

2. Выборы на вакантные должности научных работников –

докл. Н.Ю. Соколова

 

3. Утверждение тем кандидатских диссертаций –

докл. А.О. Максимова

 

4. Разное

 

 

 

И.о. ученого секретаря                                      Н.Ю. Соколова

 

 

12 апреля 2011 г.

 

 

 

К.и.н. Елена Юрьевна Матвеева,

зав. Сектором научно-библиографической информации

по гуманитарным наукам

Отдела научно-библиографической информации (ОНБИ)

Фундаментальной библиотеки

ИНИОН РАН

 

 

СТРУКТУРА БИБЛИОГРАФИЧЕСКОЙ БАЗЫ ДАННЫХ

ПО ИСТОРИИ, АРХЕОЛОГИИ, ЭТНОЛОГИИ

И ПРИНЦИПЫ ПОСТРОЕНИЯ ОТРАСЛЕВОГО ТЕЗАУРУСА

(Тезисы доклада на заседании Ученого совета ИНИОН РАН
21 апреля 2011 г.)

 

1. Автоматизированная информационная система по общественным наукам (АИСОН) ИНИОН РАН начала создаваться более 20 лет назад. Отраслевая библиографическая база данных по истории, археологии и этнологии (далее – БД) формируется в рамках АИСОН с 1986 г. и насчитывает к настоящему моменту около 450 тыс. документов (книг, сборников, статей, авторефератов, рецензий и др.). Из них документы по истории (отечественной и всеобщей, с древности до современности) составляют 64 %, по археологии – 16 %, этнологии – 13 %, антропологии – 1 %. Документы по истории и современному состоянию исторической науки (ее методологии и методах, исторических научных учреждениях, персоналиях историков и пр.) составляют 6 %.

В общем массиве документов две трети – документы на русском языке, причем доля отечественной литературы увеличивается с каждым годом. Такое положение объясняется несколькими факторами. Во-первых, все меньше валютных средств выделяется на закупку литературы и, соответственно, сокращается иностранное комплектование. Во-вторых, налицо издательский бум в нашей стране, когда практически каждое высшее учебное заведение издает труды своих сотрудников и аспирантов. В-третьих, неудовлетворительным следует признать кадровое положение в ОНБИ – в отделе все меньше специалистов со знанием языков. Плохо обрабатывается или вовсе не включается в БД литература на романских, славянских и восточных языках.

 

2. При обработке (индексировании) документов, вводимых в БД, на каждый документ составляется так называемый «рабочий лист», в котором кроме стандартного библиографического описания (автор, заглавие, источник и пр.) имеются поля аннотации, рубрики Рубрикатора АИСОН и поискового образа документа (ПОДа). ПОД составляется из набора дескрипторов и ключевых слов, которые в совокупности с максимальной полнотой и точностью должны отобразить содержание документа.

Принято считать, что дескриптор – это термин (слово или словосочетание), нормализованный в данном информационно-поисковом языке, зафиксированный в тезаурусе и выражающий основное содержание текста. При этом дескриптор в своем содержании должен «вобрать в себя» целый комплекс синонимичных или близких по значению понятий, являясь своего рода «этикеткой» для такого комплекса. По форме дескриптор является обычной лексической единицей, используемой в языке данной науки, например, «абсолютизм», «крестьянство», «культовые сооружения», «керамика».

Кроме дескрипторов для описания содержания документа используются ключевые слова – также лексические единицы языка науки, но не зафиксированные в тезаурусе. Библиограф, обрабатывающий книгу или статью, сам определяет необходимость их включения в ПОД. К классу ключевых слов следует отнести новые термины, а также разного рода имена собственные – имена и фамилии людей, географические названия, названия учреждений, письменных памятников, конкретно-исторических событий и фактов («Русско-турецкая война 1877-1878», «Русское археологическое общество», «Александр II», «Османская империя», «Тверское княжество» и пр.).

 

3. Результатом нормализации дескрипторов, относящихся к какой-либо отрасли знаний, является информационно-поисковый тезаурус (ИПТ) – словарь дескрипторного информационно-поискового языка с зафиксированными в нем парадигматическими отношениями лексических единиц. Эти отношения оформляются в виде словарной статьи, которой снабжается дескриптор. В словарной статье могут быть указаны вышестоящие (помеченные буквами BT) и нижестоящие (NT) дескрипторы, синонимы (UF)), запрещенные к использованию при индексировании и подлежащие замене одним или несколькими дескрипторами. Кроме того, в словарную статью входят дескрипторы, ассоциативно связанные с данным дескриптором (RT), а также ряд других справок и помет, касающихся особенностей использования данного дескриптора.

 

Пример.

Дескриптор: крепостные крестьяне

                              BT       крестьянство

                              NT       помещичьи крестьяне

                                             монастырские крестьяне

                              RT       крепостное право

                                             крепостная интеллигенция

                                             закрепощение крестьянства

                                             отмена крепостного права

                              UF        крепостные

                                             дворовые

 

ИПТ, как правило, включает в себя несколько указателей. Основной – лексико-семантический указатель, в котором в алфавитном порядке перечислены все дескрипторы и недескрипторы (синонимы) с указанием их парадигматических отношений. Важную роль при индексировании и поиске играет пермутационный указатель, в котором в алфавитном порядке перечислены все отдельные слова, входящие в словосочетания, обозначающие дескрипторы. Такой указатель, обеспечивает поиск дескрипторов-словосочетаний по любому слову, входящему в их состав. Часто в состав ИПТ входит систематический указатель, в котором перечень лексических единиц построен согласно с принятой в данной отрасли знаний классификацией.

Все входящие в ИПТ указатели в комплексе обеспечивают решение двух основных задач: качественного индексирования документов, включаемых в БД, и информационных запросов, формулируемых потребителями (так называемое «координатное индексирование»).

 

4. В основе информационно-поискового тезауруса по истории, археологии и этнологии лежат следующие методологические установки:

4.1. История, археология и этнология представляют собой три самостоятельные научные дисциплины, но тезаурус должен быть единым, охватывающим терминологию всех трех наук, так как наряду со специфической лексикой, присущей только каждой из них (например, «индустриализация», «культурный слой», «лечебная магия»), весьма значительна доля лексики «общей» (например, «предметы быта», «религиозные культы», «этнокультурные связи»). В этом случае при общем объекте предмет исследования будет различным.

4.2. В тезаурус включаются только дескрипторы. Так называемые «идентификаторы», то есть имена собственные (антропонимы, топонимы и др.), используемые как дескрипторы, в основные указатели не включаются. за исключением нескольких, наиболее часто употребляемых, которые тесно связаны с дескрипторами синонимическими, ассоциативными и прочими связями (например, «Великая Отечественная война», «Библия» и др.). В дальнейшем из них предполагается сформировать несколько дополнительных фасетов (нормализованных списков). В настоящее время разрабатываются фасеты археологических культур, географических названий, исторических событий, народов мира, методов археологических исследований.

4.3.  Основу тезауруса составляет лексика, собранная библиографами в процессе индексирования в течение 15 лет. При этом в тезаурус в качестве дескрипторов включена и новая терминология. Это связано с двумя факторами.

Во-первых, за эти годы значительно изменилась сама тематика исторических исследований. В отечественной историографии исчезла так называемая «историко-партийная наука». Почти полностью исчезли работы по истории революционного, рабочего, крестьянского и других общественных движений. Содержание социальной истории эволюционировало от изучения крупных социальных процессов в направлении исторической антропологии. Резко возросло количество исследований так называемой «истории снизу» – поведения, обычаев, ценностей, представлений, верований различных социальных групп. Настоящий бум переживают интеллектуальная история, биографистика, история семьи (семейно-брачных отношений, сексуальности, положения женщин и детей в семье, наследования и т.д.), локальная история (коллективная биография деревни, прихода, городской общины, ремесленного цеха и пр.) Появление множества новых объектов исследования вызвало необходимость появления новых дескрипторов, отображающих содержание этих объектов.

Во-вторых, увеличение количества документов в БД потребовало «раздробления», конкретизации понятий для того, чтобы уменьшить количество документов, выдаваемых потребителю, и, соответственно, «шум» при поиске документов. Например, при запросе по дескриптору «общественно-политическая мысль» будет выдано 8 тыс. документов, по дескриптору «политическая система» – 5 тыс. документов.

 

4.4. Выявление и нормализация новой лексики осуществлялись путем просмотра документов в БД (прежде всего, заголовков и аннотаций), а также путем просмотра новейших отечественных и зарубежных словарей, справочников, энциклопедий, монографических и обобщающих изданий.

4.5. Включение в тезаурус большого количества новой лексики не означает, что «старая» лексика исключается из тезауруса. К некоторым дескрипторам дается справка, что они использовались до 2011 г., некоторые меняют свой статус (из дескрипторов превращаются в синонимы) и также снабжаются подобной пометой.

 

5. Начавшаяся эксплуатация информационно-поискового тезауруса по истории, археологии и этнологии обеспечивает единообразие и качество обработки документов и, соответственно, качество обслуживания потребителей научно-библиографической информации.