III . БАЗЫ ДАННЫХ БИБЛИОГРАФИЧЕСКИЕ И РЕФЕРАТИВНЫЕ БД Библиографические (реферативно-библиографические) БД содержат описания публикуемых (книги, статьи, доклады, тезисы и пр.) и непубликуемых (авторские свидетельства и патенты, отчеты, диссертации и др.) документов, для которых обычно дается полное библиографическое описание, набор ключевых слов и рубрикационных шифров, раскрывающих тематику и содержание документа, а также приводятся рефераты или аннотации работ. В отличие от ПС WWW , которые осуществляют автоматическое индексирование документов с помощью программ-роботов, формирование информационных массивов библиографических и любых иных БД обязательно включает процесс предварительного индексирования первоисточников классификационными шифрами, ключевыми словами и дескрипторами. Это дает возможность поддерживать жесткую структуру описания индексируемых документов по определенным полям, что обеспечивает гораздо лучшие результаты поиска. В том случае, когда для автоматизированного информационного поиска используются рефераты, это существенно повышает количество найденных релевантных документов. Поэтому в электронные версии некоторых традиционных библиографических изданий (Index Medicus, Current Conents, Scienc e C itation Iindex) стали включаться авторские резюме. Одна из наиболее известных библиографических БД - универсальная БД UnCover ( http :// uncweb . carl . org / ), владельцем которой является UnCover Company . Она содержит более 8.800.000 описаний статей из 18.000 журналов с 1988 года по настоящее время. Ее информационный массив ежедневно пополняется несколькими тысячами новых записей. Поиск в БД осуществляется по автору, ключевым словам, названию периодического издания или по всем полям одновременно (см. рис.61). Рис.6 1 . Поисковый интерфейс БД UnCover . Поддерживается использование логических операторов AND, OR и NOT, а также поисковая функция усечения справа с помощью знака "*". В результате поиска пользователь получает список библиографических описаний, состоящих из ограниченного набора элементов, необходимых для идентификации документа. Это объясняется тем, что БД UnCover создавалась на основе оглавлений научных журналов и долгое время существовала в качестве вспомогательного библиографического массива для службы электронной доставки документов. Необходимо отметить, что библиографические БД формируются преимущественно по отраслевому или тематическому признаку. В качестве примера отраслевой БД рассматриваемого типа можно привести БД Geobase ( http://chemweb.com/databases/ ). Ее владельцем является компания Elsevier. Эта реферативно-библиографическая БД ведется с 1998 года. Она включает библиографические записи и рефераты из 3.000 наименований журналов и более чем 2.000 других официально публикуемых источников (книг, трудов конференций, тезисов диссертаций и т.д.). В данный момент ее объем насчитывает более 600 000 записей. Тематика БД -это науки о Земле (география, океанография, экология и т.д.). Все записи предоставляются читателям вместе с аннотациями. Поиск в базе осуществляется бесплатно. Существует возможность заказа копий статей, библиографическая информация о которых представлена в базе. Для получения доступа требуется предварительная регистрация. Среди отечественных информационных продуктов необходимо отметить целый комплекс отраслевых БД, генерируемых ИНИОН. Немаловажным фактором здесь является то, что доступ к этим БД предоставляется бесплатно. БД ИНИОН ( http :// www . inion . ru )
Библиографические БД ИНИОН по социальным и гуманитарным наукам ведутся с 1980 года. Совокупный объем информационных массивов составляет более 2,5 миллионов записей, а темпы его ежегодного прироста - от 80 до 100.000 записей. В БД включаются аннотированные описания книг и статей из журналов и сборников на 140 языках мира, поступивших в библиотеку ИНИОН. На сервере ИНИОН ( http :// www . inion . ru ) предоставляется доступ к нескольким сводным каталогам, отражающим поступление литературы за определенные периоды времени (1993-1995, 1996-1998, 1999-2000 годы). Кроме того пользователи могут работать с целым комплексом БД социально-экономического и гуманитарного профиля, куда входят БД по литературоведению; государству и праву; языкознанию; философии и социологии; экономике и демографии; истории, археологии и этнологии; науковедению; религиоведению; востоковедению. При формировании информационных массивов используются следующие типы источников: статьи из журналов и сборников, книги (монографии, ежегодники, сборники статей, материалы конференций, библиографические указатели и т.д.), депонированные рукописи, авторефераты диссертаций. Каждая запись содержит библиографическое описание первоисточника, аннотацию на русском языке, термины (ключевые слова и дескрипторы) на русском и английском языках, коды рубрикатора ИНИОН, код языка первоисточника, шифр ИНИОН. Кроме того часть описаний статей и книг снабжена динамическими ссылками на полные тексты источников из электронного хранилища ИНИОН и из электронных издательств (101 электронный журнал издательств Elsevier и Kluwer из Научной электронной библиотеки). На данный момент электронное хранилище насчитывает более 5.000 документов в формате PDF и более полутора тысяч документов в формате RTF. Все БД имеют единую систему поисковых интерфейсов. Поддерживается использование всех логических операторов и составление сложных поисковых предписаний с применением круглых скобок. Для проведения поиска по одному полю или совокупности полей библиографической записи служит ряд специальных операторов (например, AU - для поиска по автору, KW - для поиска по ключевому слову и т.д.). Альтернативный вариант поискового интерфейса реализован в виде шаблона, в котором поля для ввода ключевых слов комбинируются с раскрывающимися меню. Имеется также возможность определения формы выдачи результатов поиска. БД ВИНИТИ (http://fuji.viniti.msk.su/)
БД ВИНИТИ формируется на основе материалов РЖ ВИНИТИ по естественным и техническим наукам начиная с 1981 года. За год ВИНИТИ обрабатывает около миллиона публикаций, из которых 30% составляют российские источники. Сюда входят следующие виды изданий: книги, материалы конференций, тезисы докладов, периодические издания, патенты, нормативные документы, депонированные научные работы. БД пополняется ежемесячно. Доступ к БД предоставляется на платной основе. Поиск можно проводить по авторам, заглавию документа, ключевым словам, предметным рубрикам и источнику публикации. Возможно ограничение поиска по языку документа, году издания или виду документа-первоисточника. Результаты поиска выводятся в виде библиографического описания, реферата первоисточника, предметной рубрики и номера реферата в РЖ. Пользователь может сохранить все найденные описания документов в одном файле. БД АГРОС (http://www.cnshb.ru/cnshb/ agros )
Библиографическая БД АГРОС генерируется ЦНСХБ и является одним из наиболее значительных информационых массивов отечественного АПК. Объем БД составляет более 930.000 записей, охватывающих хронологический период с 1985 года по настоящее время. Сюда входят следующие виды документов: статьи из сериальных изданий, статьи из сборников, материалы конференций, книги, авторефераты диссертаций, нормативно-технические документы, неопубликованные переводы, депонированные рукописи. Описания документов приводятся на языке документа или на английском языке. Все зарубежные документы снабжены переводом основного заглавия на русский язык. Библиографические описания частично снабжены рефератами. На основе содержания документа библиографическому описанию присваиваются рубрики Рубрикатора АСНТИсельхоз, термины Тезауруса по сельскому хозяйству, индексы УДК и ключевые слова. Документы, хранящиеся в ЦНСХБ, могут быть предоставлены пользователю как через службу МБА, так и службу электронной доставки документов. БД MEDLINE
Одной из наиболее известных тематических зарубежных реферативно-библиографических БД является БД Medline. Она была создана в 1966 году. Владелец базы - компания Medline Industries. БД Medline содержит библиографические описания и рефераты статей по медицине, хирургии, стоматологии, уходу за больными и организации здравоохранения, опубликованных в международных биомедицинских журналах, издающихся в 71 стране мира. БД обновляется еженедельно. В настоящее время содержит более 11 миллионов описаний статей из 4500 журналов начиная с 1966 по настоящее время. Генератором базы является Национальная медицинская библиотека США (National Library of Medicine), которая затем передает свой продукт различным фирмам (Ovid Technologies, KR On Disk, SilverPlatter и др.) которые поставляют на рынок коммерческие версии Medline. С 1995 года открывается онлайновый доступ к БД Medline. С 1997 года обеспечивается бесплатный доступ к Medline через Интернет. Работа с информационным массивом БД осуществляется с помощью двух ПС: GratefulMed и PubMed. ПС PubMed является основной для работы с БД Medline. Она функционирует на одном сервере с самой БД, что существенно повышает скорость обработки запросов по сравнению с альтернативными ПС, расположенными на других серверах. ПС Internet Grateful является одной из новых разработок Национальной медицинской библиотеки США. Она позволяет осуществлять поиск не только в БД MEDLINE, но и в 14 других БД (AIDSLINE, AIDSDRUGS, AIDSTRIALS, DIRLINE, HealthSTAR, HSRPROJ, HISTLINE, OLDMEDLINE, SDILINE, SPACELINE, BIOETHICSLINE, POPLINE, TOXLINE и CHEMID). Поэтому ее поисковые функции отличаются от ПС PubMed. Значительные массивы информации, сосредоточенные в БД Medline, предполагают наличие поискового интерфейса, который должен в полной мере способствовать раскрытию информационного потенциала базы. Ниже приводится подробное описание возможностей интерфейса ПС PubMed ( http://www.nlm.nih.gov/databases/freemedl.html ), который наиболее активно используется читателями библиотек. В российских библиотеках пользователи могут получить доступ к БД Medline на сервере РБА. | ИПС PubMed http://www.nlm.nih.gov/databases/freemedl.html | Простой поиск На странице простого поиска расположено поле для ввода запроса (см. рис. 62), а также ссылки на ресурсы National Center for Biotechnology Information ( Nucleotide , Protein и т.д.). Меню под полем для ввода запроса обеспечивает доступ к дополнительным режимам поиска ( Limits , Preview / Index и т.д.), каждый из которых будет рассмотрен отдельно. Рис.62. Поле для ввода ключевых слов БД Medline. При обработке запроса ключевые слова по умолчанию связываются логическим оператором AND . При составлении поискового выражения можно использовать логические операторы AND , OR , NOT , введенные прописными буквами . Строчные и прописные буквы при поиске не различаются. ПС P ub Med поддерживает функцию усечения справа с помощью знака "*". При этом будут найдены первые 150 вариантов слова. Если слова, введенные в строку запроса, являются устойчивым словосочетанием в медицинской терминологии, P ub Med воспринимает их как фразу. Чтобы отменить поиск по фразе, нужно объединять слова оператором AND . Для принудительного поиска по фразе можно использовать двойные кавычки. По умолчанию P ub Med ищет слова запроса во всех областях описания документов. Чтобы ограничить поиск определенной областью описания документа, можно использовать специальные операторы. Специальные операторы заключаются в квадратные скобки и располагаются после ключевого слова без пробела. Специальные операторы можно использовать в сочетании с логическими (например: dna[mh] AND crick[au] AND 1993[dp] ). Круглые скобки используются для составления сложного поискового предписания. Например: (heat OR humidity) AND multiple sclerosis ), когда необходимо задать порядок обработки логических операторов. ПС P ub Med поддерживает следующие специальные операторы: - AB - реферат; - AU - автор; - CY - страна; - DA - дата добавления документа к базе; - DP - дата публикации; - IS - ISSN ; - LA - язык документа; - PG - номер страницы; - PS - имя персоны, как предмет; - PT - тип публикации; - SB - тема журнала; - TA - аббревиатура название журнала; - TI - слова из заглавия. Полный список специальных операторов можно найти в разделе " Help " ( http://www.ncbi.nlm.nih.gov/entrez/query/static/help/pmhelp.html ), где содержится справочная информация. При поиске по именам авторов нужно использовать следующий формат: фамилия и инициалы без знаков препинания (например smith ja, jones k .). При этом имя будет найдено только в поле " автор ". Если ввести фамилию автора без инициалов, поиск будет производиться во всех областях записи. По умолчанию ПС PubMed ищет все варианты имени и фамилии. Например, на запрос smith j будут найдены: smith ja, smith jb, smith j jr и т.д. Для задания более четких параметров поиска нужно после первого инициала поставить знак "@", тогда по запросу smith j@ будут найдены только smith . Поиск периодического издания можно проводить либо по полному названию ( molecular biology of the cell ), либо используя сокращения ПС PubMed ( mol biol cell ), либо по номеру ISSN (например: 1059-1524 ). Даты вводятся в формате "гггг/мм/дд", например 1997/10/06 . Диапазон дат указывается через двоеточие, например: 1997/01:1997/06 ). Для поиска статей с рефератами к поисковому выражению надо добавить ключевое слово " hasabstract ", например neoplasms AND hasabstract . Специальные операторы при этом не используются. Расширенный поиск Расширенный поиск в БД можно осуществлять с использованием различных режимов, которые называются Limits , Preview / Index , History , Clipboard . Режим Limits Данный режим содержит поле для ввода запроса и набор фильтров Limited to , ограничивающих область поиска по различным параметрам (см.рис. 63). Рис.63. Интерфейс режима Limits БД Medline. При включенной опции " Only Items with Abstracts " будут найдены только те статьи, которые снабжены рефератами (статьи до 1975 года не включают рефератов). Опции раскрывающегося меню " All Fields " ограничивают область поиска определенными полями описания документа. Фильтр " Publication Types " ограничивает область поиска типом публикации. Раскрывающееся меню " Languages " позволяет искать документы на английском, французском, немецком, итальянском, японском, русском и испанском языках . Фильтры " Ages " , " Gender " и " Human or Animal " позволяют ограничить область поиска статьями, в которых объектами изучения являются животные или группы людей определенного пола и возраста. Фильтр " Dates " дает возможность поиска документов по дате их публикации или дате регистрации в БД. Режим Preview/Index Данный режим поиска позволяет узнать количество найденных статей перед тем, как результат будет выведен на экран. Для этого нужно ввести запрос и нажать кнопку Preview , после чего на экране появится информация о количестве статей, найденных в результате запроса. Для просмотра списка найденных документов необходимо нажать кнопку Go . (см .рис.64). Рис.64. Поле для ввода ключевых слов в режиме Preview/Index БД Medline. Кроме того данный режим предлагает пользователю простой способ для составления запросов с использованием логических и специальных операторов. Для этого служит шаблон для добавления ключевых слов в поле для ввода запроса. Он состоит из раскрывающегося меню " All Fields ", текстового поля и кнопок " Preview ", " Index ", " AND ", " OR ", " NOT " ( см . рис .65). Рис.65. Шаблон для добавления ключевых слов в поле для ввода запроса БД Medline . Чтобы присоединить ключевое слово к поисковому выражению с соответствующим оператором, надо нажать кнопку " AND " , " OR " , или " NOT " . После чего оно появляется в поле, изображенном на рис.64. Перед тем, как добавить ключевое слово к поисковому выражению, можно узнать общее число статей, которые содержат это слово (кнопка " Preview ") или получить алфавитный список словосочетаний, которые содержат это слово (кнопка " Index "). В скобках указывается количество статей, содержащих введенное слово или словосочетание (см. рис.66). Рис.66. Поле для вывода списка словосочетаний по ключевому слову БД Medline. Режим History ПС PubMed сохраняет информацию о результатах поиска в следующей форме: порядковый номер поиска, время проведения поиска, поисковое выражение и количество найденных статей (см. рис.67). Рис.67. Информация о результатах поиска БД Medline. К результатам каждого конкретного поиска можно перейти по ссылке, указывающей количество найденных статей. Среди статей, найденных в результате предыдущих запросов, можно проводить новый поиск. Для этого в поле для ввода запроса достаточно ввести порядковые номера запросов со знаком # перед числом и оператор AND (например: #2 AND #6 ). Для сужения области поиска можно добавлять новые ключевые слова (например: #3 AND ( drug therapy OR diet therapy ) ). ПС PubMed хранит информацию о 100 последних запросах. После добавления 101 запроса информация о самом первом удаляется. Очистить историю поиска можно с помощью кнопки " Clear History ". Режим Clipboard Данный режим дает возможность сгруппировать выбранные записи одного или нескольких исследований. Максимальное количество записей в буфере обмена 500. Чтобы добавить запись в буфер обмена, необходимо нажать кнопку " Add to Clipboard ", которой снабжены все результаты поиска. Результаты поиска Результаты поиска ранжируются по степени релевантности. Формат выдачи результатов состоит из следующих элементов: автор и заглавие статьи, название периодического издания с указанием года, тома, номера выпуска и количества страниц, регистрационный номер в базе(см. рис.68). Рис.68. Формат выдачи результатов поиска БД Medline. В верхней части страницы указывается количество документов, найденных по запросу. Кнопка " Save " дает возможность сохранения результата целиком, независимо от количества записей на экране (максимально - 10.000). ПОЛНОТЕКСТОВЫЕ БД Полнотекстовые БД определяются как БД, в которых хранятся записи полнотекстовых документов или их частей. Полнотекстовые БД значительно расширяют возможности доступа, предоставляя один и тот же текст в различных форматах ( ascii text , . html , . sgml , .pdf), включая иллюстрации, графики и таблицы изображения. В качестве примера полнотекстовых БД можно назвать такие известные БД как ProQuest (владелец Bell & Howell Information and Learning Company), комплекс баз корпорации EBSCO Publishing , БД " Literature On - line Chadwyck ", которая содержит полные тексты более чем 290.000 произведений английской и американской художественной литературы, а также биографические, библиографические и справочные материалы. Основным разработчиком, производителем и поставщиком БД ProQuest Direct ( http://www.umi.com/proquest/ ) является подразделение Bell & Howell Information and Learning информационной компании Bell & Howell ( http :// www . bellhowell . com /), ранее известное как University of Microfilms International - UMI , The Answer Company . БД ProQuest Direct представляет собой ИПС c w eb-интерфейсом, которая обеспечивает доступ к крупнейшим библиографическим реферативным и полнотекстовым БД. Источниками для формирования этого информационного массива служат газеты, журналы, информационные бюллетени, диссертации и другие виды изданий на английском языке по всем отраслям научной деятельности. Материалы на других европейских языках представлены ограничено. Совокупный объем источников превышает 5000 наименований периодических изданий. Единицей хранения в БД ProQuest Direct выступает документ в виде полного библиографического описания, которое может быть снабжено рефератом или аннотацией. Полные тексты документов, включающих иллюстрации, могут быть представлены в разных форматах. В табл.3 приводится перечень БД ProQuest Direct с кратким описанием. Табл . 4. Описание БД ProQuest Direct. Название БД | Перечень дисциплин | Бизнес и управление | ABI/Inform | банковское дело, бухгалтерский учет и анализ хозяйственной деятельности, государственное управление, здравоохранение, компьютеры и телекоммуникации, менеджмент, маркетинг, налогообложение, охрана окружающей среды и природопользование, право, управление персоналом, финансы, экономика | Accounting & Tax Database | аудит, банковское дело, бухгалтерский учет и анализ хозяйственной деятельности, налогообложение | Banking Information Source | банковское дело, бухгалтерский учет и анализ хозяйственной деятельности, налогообложение, страхование, управление капиталом и финансы | ProQuest Asian Business | бизнес, финансы, экономика | ProQuest European Business | бизнес, финансы, экономика | Газетная периодика | Newspaper Abstract | бизнес, новости, политика, социальные проблемы, текущие события, экономика (аннотированные библиографические описания публикаций) | Newspapers | бизнес, новости, политика, социальные проблемы, текущие события, экономика (полнотекстовые и графические описания публикаций) | Естественнонаучные и общенаучные дисциплины | General Science PlusText | методология науки, науковедение, общенаучные проблемы, философия науки, фундаментальные науки | ProQuest Medical Library | основные медицинские дисциплины, включая кардиологию, неврологию, педиатрию, физическую терапию и т.д. | Pharmaceutical News Index | биотехнология, здравоохранение, косметика, медицинская техника, фармакология и фармация | Образование | Education PlusText | гуманитарные науки, классические языки и литература, лингвистика, образование, педагогика, филология | Career & Technical Education | автомобилестроение и автомеханика, здравоохранение, информатика и вычислительная техника, строительство, торговля | Общественно-политические, публицистические и общенаучные БД | Periodical Abstracts | научные, общественно-политические, публицистические и популярные периодические издания по всем отраслям деятельности | ProQuest Discovery | бизнес, военное дело, гуманитарные науки, детство, здоровье, издания для женщин, искусство, международные отношения, образование, общественно-политические и публицистические издания, право, психология, точные науки | ProQuest Research Library | бизнес, военное дело, гуманитарные науки, детство, здоровье, издания для женщин, искусство, международные отношения, образование, общественно-политические и публицистические издания, право, психология, социальные науки, точные науки | Resource/One | бизнес, демография, новости, политика, социальные проблемы, экономика | Социальные науки | Social Sciences PlusText | антропология, география, гуманитарные науки, здравоохранение, краеведение, международные отношения, право, социальная работа, социология | Технические науки | ProQuest Applied Science & Technology Plus | аэронавтика, вычислительная техника, машиностроение, охрана окружающей среды и природопользование, телекоммуникации, транспорт, химическая технология, физика, электротехника | ProQuest Computing | вычислительная техника, базы данных и системы управления базами данных, компьютерные сети, информатика, программирование и программное обеспечение | ProQuest Telecommunications | компьютерные сети, телекоммуникации | БД ProQuest Direct обладает простым и расширенным поисковым интерфейсом, имеет страницу создания предустановок поиска, а также содержит большое количество справочных материалов, которые дают пользователю возможность проводить эффективный поиск релевантных документов, настраивать и выбирать форматы представления документов на экране и для печати. | EBSCO PUBLISHING http://www.ebsco.com | Корпорация EBSCO Publishing предоставляет пользователям широкий спектр разнообразных информационных услуг с использованием справочных БД, электронных журналов и службы подписки для индивидуальных и коллективных клиентов. В 1999 году эта корпорация приняла решение о предоставлении доступа к целому комплексу полнотекстовых БД для библиотек из 39 стран мира, в том числе и российских. Реализация доступа была осуществлена в рамках создания консорциума библиотек при поддержке Института "Открытое общество", являющегося составной частью Фонда Дж.Сороса. Табл . 4 . БД корпорация EBSCO Publishing. Название базы | Краткое описание | Academic Search Elite | Представлены полные тексты статей из более 1.250 журналов, охватывающих социальные и гуманитарные науки, проблемы образования, культурологии и д. | Business Source Premier | Представлены полные тексты статей из более 1.400 научных журналов по проблемам управления, экономики, финансов, предпринимательства, международного бизнеса и др. | MasterFILE Premier | Представлены полные тексты статей из более 1.830 научных и научно-популярных журналов по всем областям знания | Newspaper Source | Полные тексты избранных статей из 143 американских и других зарубежных газет | Clinical Reference Systems | База данных по клинической медицине. Представляет более 7.000 медицинских отчетов, описывающих симптомы и методы лечения различных заболеваний. | Health Source Plus | Представлены полные тексты статей из 270 медицинских периодических изданий, свыше 1.000 медицинских брошюр и 23 медицинских справочников | USP DI Volume II, Advice for the Patient | БД по фармакологии и медицинский справочник для пациентов предоставляет информацию о лекарственных препаратах (употребление, противопоказания, побочные эффекты) | Comprehensive MEDLINE with FullTEXT | БД представляет собой вариант широко известной БД Medline , дополненный полными текстами статей | Перед началом поисковой сесии пользователю дается возможность выбора одной или нескольких БД. Поиск информации осуществляется в рамках единого поискового интерфейса, представленного несколькими вариантами (" Keyword Search ", " Natural Language Search ", " Advanced Search " и " Expert Search "). Keyword Search (поиск по ключевым словам) Запрос вводится в поисковое поле " Find " (см. рис.69). Допускается использование логических операторов AND, OR и NOT. Рис. 69. Поле поиска по ключевым словам. Поддерживается функция усечения справа с использованием символа "*". Операторы близости " N " и " W " служат для определения расстояния между словами запроса. Например, в запросе tax N5 reform расстояние не должно превышать пять слов, а в запросе tax W5 reform должно быть не менее пяти слов. Natural Language search (поиск по запросу на естественном языке) Данный режим позволяет вводить запрос на естественном языке, т.е. в поисковое поле вводится фраза или предложение, которое описывает предмет поиска в произвольной форме. При обработке запроса из него исключаются предлоги и служебные слова. Для одновременного поиска по всем словам поисковое выражение заключается в кавычки. Поиск можно ограничить конкретным журналом или датой публикации. Advanced Search (расширенный поиск) Интерфейс расширенного поиска представлен в виде шаблона, состоящего из словарного фильтра и нескольких областей для уточнения запроса. Словарный фильтр состоит из четырех полей для ввода ключевых слов (см. рис. 70). Внутри каждого поля можно использовать логические операторы AND, OR и NOT. Рис. 70. Словарный фильтр расширенного поиска ( Advanced Search ). Опции раскрывающихся меню слева (" and ", " or " и " not ") служат для связи логическими операторами ключевых слов из разных полей. Опции раскрывающихся меню справа позволяют производить поиск по определенным полям описания документов: - SU ( Subject ) - предмет ; - AU ( Author ) - автор ; - TI ( Article Title ) - название статьи; - SU ( Subject ) - предметная рубрика; - AB ( Abstract )- реферат статьи; - AN ( Accession Number ) - номер статьи в БД ; - IS ( ISSN ) - ISSN; - SO ( Journal_name ) - название журнала ; - FM ( Images Available ) - наличие иллюстраций ; - AS ( Author Supplied Abstract ) - авторский реферат . Ниже расположены области " Limit Your Search " ("ограничение поиска") и " Expand Your Search " ("расширение поиска"), в которых указываются дополнительные параметры обработки запроса (см. рис. 71). Рис. 71. Области расширенного интерфейса " Limiters ". Область " Limit Your Search " дает возможность ограничить поиск конкретным журналом (поле " Journal ") и датой публикации (поле " Date Published "). Область " Expand Your Search " содержит опцию " Also search for related words " для подключения к поиску по ключевым словам синонимов и других близких по смыслу терминов. Опция " Search within full text articles " ограничивает поиск только статьями с полными текстами. EXPERT Search (профессиональный поиск) Интерфейс профессионального поиска содержит поле для ввода ключевых слов, а также области " Limit Your Results " и " Search History ". При составлении запроса допускается использование логических операторов (AND, OR и NOT) и круглых скобок для задания порядка обработки операторов. Ключевые слова можно комбинировать со специальными операторами, обозначающими коды полей (см. пояснение к рис. 70). Область " Limit Your Results " (см. рис.72) позволяет ограничивать поиск по следующим параметрам: - " Full Text " - поиск в тестах статей; - " Journal " - поик по конкретному журналу; - " Date Published " - дата публикации; - " Peer Reviewed " - статьи с рецензиями; - " Publication Type " - тип источника (книга, газета, журнал и т.д.); - " Number of Pages " - страницы статьи - " Cover Story " - обзорная статья - " Articles with Images " - статьи с иллюстрациями . Рис . 72 Область "Limit Your Results" интерфейса "Expert Search". Область " Search History " содержит информацию о предыдущих запросах, представленную в виде таблицы с колонками " Query " (слова запроса), " Limiters " (использованные операторы и ограничения), " Results " (результаты поиска) и " Revise " (возможность изменения запроса). Все результаты поиска сортируются по степени релевантности. Они выводятся в виде списка ссылок на документы. Каждая ссылка имеет ряд дополнительных обозначений, указывающих, в каком формате документ представлен в БД. Это может быть текст без иллюстраций, html -документ с иилюстрациями или файл в формате . pdf . Помимо текста каждая статья представлена полным библиографическим описанием с аннотацией или рефератом. Пользователь имеет возможность сохранить найденный документ в виде файла, отправить его по электронной почте, а также вывести на экран версию статьи, специально подготовленную для печати. БД GOV.RESEARCH_CENTER В качестве примера не менее значительного информационного массива, доступ к которому может получить не только корпоративный, но и любой индивидуальный пользователь, можно привести комплекс БД на сайте GOV . RESEARCH _ CENTER ( http :// grc . ntis . gov / database . htm ). Данный комплекс состоит из шести БД, четыре из которых являются полнотекстовыми. Бесплатно можно получить библиографическую информацию, которая в большинстве случае содержит краткую аннотацию или реферат. Полные тексты статей или иных материалов предоставляются за плату, однако некоторое количество документов (в среднем около 10 за одну поисковую сессию) пользователь может также получить бесплатно. После предварительной регистрации пользователи получают доступ к перечисленным ниже БД. БД AGRICOLA ( Agricultural Online Access ) содержит библиографические описания документов, приобретенных Национальной сельскохозяйственной библиотекой США. Ее объем составляет более 3,600,000 записей с 1970 года по настоящее время. В базе представлены статьи из журналов, монографии, тезисы докладов, патенты, а также аудиовизуальные материалы. ИПС AgroBase представляет собой интегрированную систему, в которую входят уже упомянутая БД AGRICOLA и международная БД AGRIS . БД AGRIS содержит библиографическую информацию по проблемам производства и мировых поставок продовольственных товаров и включает в себя также электронную версию печатного издания AgrIndex . Совокупный объем ИПС AgroBase составляет около 5,5 миллионов документов. БД EDB ( Energy Science and Technology Database ) содержит научно-технические отчеты Комиссии США по ядерной энергетике ( U . S . Atomic Energy Commission ), Управления энергетических исследований США ( U . S . Energy Research and Development Administration ), а также отчеты и исследования других научных организаций университетов, занимающихся данными проблемами. Объем базы составляет более 4,5 миллионов документов. БД FEDRIP ( Federal Research In Progress ) обеспечивает доступ к информации о федеральных проектах США в области физико-технических и биологических наук. Каждая запись включает название проекта, ключевые слова, дату начала и планируемую дату завершения работ, сведения об организации-исполнителе и организации, осуществляющей финансирование, принципы проведения исследования и краткое резюме о проделанной работе. БД NIOSHTIC (National Institute for Occupational Safety and Health of the U.S. Department of Health and Human Services) является библиографической БД литературы в области охраны труда и здоровья . Основной массив записей составляют книги, журналы, статьи из периодических изданий, отчеты, тезисы и доклады конференций. БД содержит более 200.000 записей в хронологическом охвате с XIX века по настоящее время. БД NTIS ( National Technical Information Service ) специализируется на сборе сведений о проектах и научных исследованиях, поучивших правительственную поддержку США или любой другой страны. БД ведется с 1990 года и содержит более 600.000 записей. Ее информационный массив включает различные типы документов, таких как технические отчеты, сообщения, аудиовизуальные материалы, файлы, программное обеспечение, стандарты и проч. Поиск во всех базах осуществляется через единую систему поисковых интерфейсов. Выбор одной или нескольких баз происходит перед началом поисковой сессии. На следующей странице пользователю предлагается перейти к одному из трех поисковых интерфейсов: простой поиск ( Quick Search ) , расширенный поиск ( Advanced Search ) и профессиональный поиск ( Expert Search ). Простой поиск ( Quick Search ) Интерфейс простого поиска состоит из четырех полей для ввода ключевых слов (см. рис.73). Два первых поля выполняют функции словарного фильтра. Поле " all of the words " служит для поиска документов, содержащих все заданные слова. По запросу, введенному в поле " any of the words " будут найдены документы, содержащие хотя бы одно заданное слово. Если ключевые слова содержатся в обоих полях, то при выдаче результатов поиска документы, в тексте которых есть все введенные слова, будут выданы в начале списка. Третье поле ограничивает область поиска по автору статьи ( Author ), последнее ( Performing Organizations ) - по коллективному автору. Рис.73. Интерфейс простого поиска системы БД GOV . RESEARCH _ CENTER . Поиск осуществляется с учетом морфологических форм слова, но без учета регистра. Для поиска точной фразы используются одиночные кавычки. Двойные кавычки служат для поиска ключевых слов, находящихся друг рядом с другом, но в произвольном порядке. Для поиска слов в указанном порядке можно использовать знак "_", например: habitat _ management . Параметры ограничения по дате создания документа вводятся с помощью следующих символов: " >", "<", ">=", "<=" и "to". Например: >1985, <1985, >=1985, <=1985, 1985 to 1996 . Кнопка " Index " выводит на экран все записи, относящиеся к указанному полю, например, " Authors ". Расширенный поиск ( Advanced Search ) Интерфейс расширенного поиска содержит панель навигации и поисковую форму. Панель навигации расположена вверху страницы. Она позволяет изменить базу, в которой будет осуществляться поиск; изменить установки поиска, принятые в системе по умолчанию (учет морфологии, ранжирование по степени релевантности и т.д.); выйти из базы или перейти в раздел, содержащий подробную справочную информацию по составлению запроса. Поисковая форма реализована в виде шаблона, состоящего из 15 основных полей, соответствующих полям описания документов в БД, а также некоторого числа дополнительных полей, состав которых меняется в зависимости от БД, с которой пользователь работает в данный момент (см. рис. 74). Рис.74. Интерфейс расширенного поиска системы БД GOV . RESEARCH _ CENTER . Основными полями являются следующие: " Author " (автор), " Title " (заглавие), " Key Terms " (ключевые слова), " Subject " (предметная рубрика), " Publication Year " (год публикации), " Publication Date " (дата публикации), " Source " (источник), " Journal Name " (название журнала), " Language " (язык документа), " Publication Type " (тип публикации), " Industry " (отрасль промышленности), " Journal Code " (код журнала, принятый в БД), " Record ID " (номер записи). Все поля объединены оператором AND . Внутри каждого поля два и более ключевых слова воспринимаются как фраза. Если слово заключено в кавычки, оно будет найдено в точной морфологической форме. Внутри полей поддерживается использование всех логических операторов, круглых скобок и символов усечения справа ("*") и в середине слова ("?"). Возле каждого поля находится ссылка на страницу справочного раздела, где содержится информация о функции данного поля в БД. Большинство полей имеет собственный индекс, т.е. заранее определенный список терминов. Использование этих терминов при поиске дает более эффективные результаты. Профессиональный поиск (Expert Search) Данный вид поиска дает пользователю возможность настройки поискового интерфейса за счет варьирования количества полей для ввода ключевых слов и другой необходимой для составления запроса информации (кнопка " Change No . of Search Sets " ) (см.рис. 75). Рис. 75. Интерфейс профессионального поиска системы БД GOV . RESEARCH _ CENTER . По умолчанию слова, введенные в любое поле, будут восприниматься как фраза. Поиск будет происходить во всех областях описания документа. Чтобы ограничить область поиска другими полями, необходимо использовать специальные операторы. Раскрывающееся меню " List of Field Tags " содержит список всех операторов и кратко поясняет их значение. Более подробную информацию можно получить в разделе "Help". Следует учитывать, что в разных БД могут использоваться разные операторы. Внутри полей поддерживается использование всех логических операторов, круглых скобок и символов усечения справа ("*") и в середине слова ("?"). Результаты поиска Все результаты поиска сортируются по степени релевантности и выводятся в кратком формате с указанием автора, заглавия и выходных данных публикации. По ссылке " View ", расположенной слева от каждой записи, можно перейти к полному формату записи и реферату статьи. Имеется возможность сохранения как всех результатов поиска, так и отдельных отмеченных пользователем записей. Среди отечественных полнотекстовых БД можно выделить базы Коммерческой службы информационного агентства "Интегрум-Техно", компании "Гарант-Парк", информационного агентства "Национальная электронная библиотека" и др. | Национальная электроная библиотека http://nel.nns.ru/ | Национальная электронная библиотека (НЭБ) представляет собой полнотекстовую БД, созданную на основе архива русскоязычных открытых информационных источников. Архив возник в 1994 году как внутренний проект Национальной службы новостей (НСН). Его развитие происходило за счет сбора текущих публикаций и покупки уже существующих информационных архивов (электронные архивы агентства "Постфактум", архивы региональной прессы и т.д.). На сегодняшний день фонды архива содержат материалы газет, журналов, агентств, информационно-аналитических институтов, теле- и радиостанций, современных и опубликованных до 1994 года. В БД НЭБ представлены русскоязычные СМИ практически из всех регионов России, стран СНГ, Балтии и дальнего зарубежья. Единое поисковое пространство объединяет более 7.500.000 документов. Ежедневно НЭБ обрабатывает до 15.000 новых документов. Полнотекстовая информация поступает из более чем 500 источников СМИ. Материалы примерно 70 ведущих печатных изданий СМИ попадают в фонды НЭБ до выхода в свет, а сообщения информационных агентств заносятся в базу в режиме реального времени. Всего же каталог НЭБ насчитывает более 2.000 информационных источников. Встроенная ПС архива НЭБ осуществляет полнотекстовый поиск с использованием логических операторов AND (&), OR ("|") и NOT ("!"). Допускается составление сложных поисковых предписаний с помощью круглых скобок. Оператор близости " within " позволяет ограничить расстояние между ключевыми словами определенным количеством других слов документа. Поддерживается функция усечения справа и в середине слова с помощью символов "*" и "?". Поиск документов можно проводить по полями их описания: - source (источник); - headline (заголовок); - author (автор); - issue (выпуск); - text (текст документа). Возможно сужение области поиска по дате публикации материалов. НЭБ выпускает еженедельные и ежедневные тематические обзоры, иллюстрированные собственными рейтингами. Они охватывают такие области, как банковская деятельность, внутренняя и международная политика, культура, преступность, макроэкономика, прогнозируемые отставки и назначения во властных центральных и региональных структурах. Коммерческая служба БД информационного агентства "Интегрум-Техно"
Коммерческая служба БД информационного агентства "Интегрум-Техно" ( http://www.integrum.ru/win/databases ) предоставляет доступ к целому комплексу различных БД, в числе которых полнотекстовые базы по законодательству, центральным и региональным периодическим изданиям, библиографические базы данных ЦНСХБ и ИНИОН и другие источники. Доступ к полным текстам документов осуществляется за плату. Одним из главных факторов при отборе информационных материалов службы баз данных "Интегрум-Техно" является общественная потребность. Именно поэтому "Интегрум-Техно" не акцентирует свое внимание на сборе информации исключительно из СМИ или специализированных источников. Комплектование службы баз данных осуществляется с учетом разнообразных тематических материалов, отражающих социально-политические и экономические интересы общества. По данным агентства на сегодняшний день в базе содержится свыше 30 миллионов документов, свыше 1500 полнотекстовых источников. Каждый месяц вводится в эксплуатацию до 30 новых источников. Каждый день поступает до 10.000 новых документов. Обновление службы баз данных производится в момент поступления информации от первоисточника. Поиск может осуществлятся как по отдельной базе, так и по всему информационному массиву в целом. Поддерживается использование логических операторов И, ИЛИ и НЕ, а также поиск по фразе, которая заключается в кавычки. Поисковый интерфейс состоит из поля для ввода ключевых слов, двух полей для ограничения поиска по дате создания документов, а также нескольких дополнительных опций. Опция "в одном предложении" определяет степень близости ключевых слов, опция "однокоренные слова" позволяет производить поиск с учетом морфологических форм слова и опция "с ранжированием" определяет сортировк найденных документов по степени релевантности. БД компании "ВК-Кодекс" (http://www.kodeks.net/) Совместная компания "ВК-Кодекс" по производству и распространению электронных правовых справочников и специализированных справочных систем учреждена государственным предприятием "Центр компьютерных разработок" (создателем и распространителем известной информационно-правовой системы "Кодекс") и голландской издательской фирмой "Wolters Kluwer" ( http://www.wolters-kluwer.com/ ). Информационно-правовая система "Кодекс" является одним из крупнейших в России банком правовой информации. Она содержит более 200.000 нормативно-правовых документов федерального законодательства, международного права, законодательств Москвы, Санкт-Петербурга и других регионов России, образцы правовых и деловых документов, комментарии, статьи, консультации, словари, электронные версии экономических, юридических газет и журналов и другие материалы. Сегодня ИПС "Кодекс" распространяется во всех регионах России и за рубежом. Эта система установлена в Совете Федерации и Государственной Думе РФ, в Конституционном и Высшем Арбитражном Судах России, других федеральных и региональных органах власти, на предприятиях и в организациях практически всех отраслей экономики. Администрацией Санкт-Петербурга и Законодательным собранием Ленинградской области ИПС "Кодекс" присвоен статус официальной системы. Это означает, что тексты правовых актов, принятые соответствующими органами власти и распространяемые в составе ИПС "Кодекс", рассматриваются как официальные машиночитаемые тексты. Качественная юридическая обработка материалов позволяет широко применять их не только специалистам, но и неквалифицированным пользователям. Компания "ВК-Кодекс" предоставляет свободный онлайновый доступ к следующим БД и информационным массивам: БД "Проекты нормативных актов Санкт-Петербурга", БД "Законодательство Санкт-Петербурга", БД "Законодательство о выборах в Санкт-Петербурге"; информационная система "Все налоги России", обзоры законодательства России, Санкт-Петербурга и Москвы; "Юридический словарь" и "Большая Российская юридическая энциклопедия". Консультант-Плюс (http://www.consultant.ru/) Общероссийская сеть "Консультант-Плюс" является крупнейшей сервисной сетью, работающей на российском рынке информационно-правовых услуг. Системы "Консультант-Плюс" по законодательству включают в себя весь массив официальной правовой информации: от основополагающих документов РФ, затрагивающих интересы всех предприятий и граждан, до ведомственных и узкоотраслевых актов, регулирующих работу отдельных категорий предприятий и граждан. Новые нормативные акты включаются в БД ежедневно, в течение нескольких дней с момента их подписания органами власти и управления РФ. На сегодняшний день информационный массив системы содержит более 651.000 документов. "Консультант-Плюс" предоставляет пользователям свободный онлайновый доступ к следующим БД: "Консультант-Плюс Налоги и Бухучет", "Консультант-Плюс: ВерсияПроф" и "Международное гуманитарное право, применяемое во время вооруженных конфликтов". БД " Консультант-Плюс Налоги и Бухучет " содержит более 7.800 необходимых бухгалтеру документов. Это Налоговый кодекс РФ (проект и принятые разделы), документы Президента РФ и Правительства РФ, законы, регламентирующие ведение бухучета и определяющие порядок исчисления и уплаты налогов, акты Минфина, МНС, Пенсионного фонда и др. В БД также включаются документы по гражданскому и трудовому праву, календарь бухгалтера и справочная информация. Доступ к БД открыт круглосуточно. В БД " Консультант-Плюс: ВерсияПроф " представлены все нормативные акты РФ, включая все ведомственные акты, зарегистрированные в Минюсте РФ. Значительную часть документов системы составляют правовые акты разъяснительного характера. Всего в БД содержится более 29.800 документов. Свободный доступ к БД предоставлен в рамках проводящейся компанией "Консультант Плюс" Программы поддержки российской науки и образования. Доступ открыт в будни с 20.00 до 24.00 и по выходным дням с 00.00 субботы до 24.00 воскресенья. БД " Международное гуманитарное право, применяемое во время вооруженных конфликтов " содержит более 40 важнейших правовых актов, в том числе тексты оговорок и заявлений, сделанных Россией при подписании документов. Обновление и пополнение БД происходит только по мере принятия новых документов в области международного гуманитарного права или изменения информации об имеющихся в системе документах. Работа над созданием БД была проведена в соответствии с трехсторонним соглашением, заключенным Международным комитетом Красного Креста, Правовым управлением Аппарата Государственной Думы и компанией "Консультант Плюс". Доступ к БД открыт круглосуточно. БД компании "Гарант-Парк"
БД компании "Гарант-Парк" ( http ://www.garant.ru ), которая специализируется на правовой информации, на данный момент насчитывает более миллиона документов из приблизительно 160-170 полнотекстовых источников информации (центральные и региональные информационные агентства, газеты, журналы, каталоги, справочники, обзоры, материалы законодательных и исполнительных государственных структур). Компания выпускает специальный дайджест по материалам, поступающим в БД бесплатно. *** Сведения о БД, доступных онлайн, можно найти в соответствующих справочниках (например, "The North American Online Directory" издательства Bowker, "Российская энциклопедия по информации и телекоммуникациям" и т.д.) или воспользоваться средствами поиска WWW (ИПС, каталоги Интернет-ресурсов). Кроме того, ниже приводятся примеры web -сайтов, которые также могут содержать полезную информацию. ИПС Internets.com ( http :// www . internets . com / index . htm ) представляет собой специализированную ПС, в которой проиндексировано более 1000 БД в сети Интернет по всем областям знаний. Кроме БД индексируются также web-сайты. Поиск осуществляется либо по ключевым словам, либо по тематическим разделам. Результаты поиска представлены в виде мультипоисковой страницы. Она содержит ссылки на другие разделы Internets.com, где может содержаться искомая информация; новостной раздел; список самих БД по теме (Searchable Databases); а также важный раздел InLine Databases, где полностью или частично представлены поисковые интерфейсы наиболее крупных БД по теме с возможностью осуществления поиска без захода на сами сайты этих БД. Сведения об онлайновых БД могут содержаться на сайтах университетов, институтов и колледжей, библиотечных, информационных или исследовательских центров. На сайте Research Databases ( http :// www . lib . duke . edu / databases / a . html ) представлена информация о более чем 100 БД. Основной перечень расположен в алфавитном порядке. Описание состоит из заголовка базы и краткой аннотации. По ссылке "More Info" можно получить более подробное описание БД, включающее сведения о тематике, типе описываемых материалов, хронологическом охвате, условиях доступа и т.д. Пользователям предлагается возможность поиска БД по точному названию, словам из названия и по ключевым словам из описания БД. По ссылке " Full text databases " можно перейти к списку полнотекстовых БД. Возможен также подбор БД с помощью тематических разделов: архитектура и искусство, бизнес и экономика, законодательство, здравоохранение, справочно-адресные БД, философия, социально-экономические науки и т.д. Обширный и хорошо структурированный список онлайновых БД представлен на специализированном сайте FabiO ( http://www.bsz-bw.de/wwwroot/text/fabioA.html ), который поддерживается библиотечно-информационным центром в Баден-Вюртемберге. | |